pandas

"Pandas" 是金融科技领域的关键工具之一。它是一个强大的Python数据处理库,特别适用于金融数据分析、清洗和预处理。其DataFrame和Series数据结构能够高效地处理时间序列数据,如股票价格、交易量和财务指标等。通过Pandas,金融分析师可以快速进行数据切片、聚合、转换和可视化,进而洞察市场趋势,评估投资风险,并做出更明智的金融决策。

Pandas基础操作技能get! 强烈推荐!

旧版声明

本文为旧版实现,仅供学习参考。

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU


下列代码在读取数据时,使用最新dai.query接口即可。

数据读取

\

策略案例

[https://bigquant.com/codesharev2/5509a634-c207-4eaf-a6f2-a73d15fada39](https://bigqua

更新时间:2024-06-12 07:41

Pandas库之数据处理与规整

旧版声明

本文为旧版实现,仅供学习参考。

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU


下列代码在读取数据时,使用最新dai.query接口即可。

数据读取

\

导语

本文继续讲解Pandas库在数据分析和处理上的一些应用。

[https://bigquant.com/codesharev2/5a39d584-7b74-4d00-832f-

更新时间:2024-06-12 02:36

10分钟学会Pandas

SELECT date, open, high, low, close

FROM bar1d_CN_STOCK_A

WHERE instrument = '000005.SZA'

AND date BETWEEN '2017-01-06' AND '2017-02-10'

ORDER BY date;

10分钟学会Pandas

Pandas最初被作为金融数据分析工具而开发出来,在金融领域被广泛使用。Pandas纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具、函数和方法。

本文是针对pandas新手的快速入门学习指南。你可以在 **AI量化平台-编写策略

更新时间:2024-06-11 08:57

Pandas处理日K数据构建MACD季度因子

看视频

https://www.bilibili.com/video/BV1jh411u7zj/?vd_source=ecd29bbd04cbefdfa426167c55241973

策略源码

[https://bigquant.com/experimentshare/d4804cb7b37b40e191de5b196897c33b](https://bigquant.com/experiment

更新时间:2024-06-07 10:55

numpy和pandas的区别关系及作用

Numpy(Numerical Python)和Pandas两个库是Python编程语言中两个极其重要的库,尤其在数据科学、金融分析和量化投资领域。尽管它们在处理数据方面有所重叠,但各自设计的初衷和优势领域有所不同。

Numpy简介

  • 核心功能:Numpy是一个开源的Python库,用于科学计算。它提供了一个高性能的多维数组对象和这些数组的操作工具。
  • 设计初衷:为数学运算、尤

更新时间:2024-05-20 02:35

Pandas使用小技巧


https://bigquant.com/experimentshare/1e185519774149e6803c36f1e6ecb1e6

\

更新时间:2024-05-20 02:34

Pandas查看和选择

导语

本节主要讲解Pandas库中 DataFrame 的数据查看与选择


Pandas 是基于 Numpy 构建的,让以 Numpy 为中心的应用变得更加简单。平台获取的数据主要是以 Pandas 中DataFrame 的形式。除此之外,Pandas 还包括 一维数组Series 以及三维的Panel。

Pandas中获取数据的方式

下面将进行详细介绍:

Series:一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近,其区别是:List中的元素可以是不同的数据类型,而Array和Series中则只允许存储相

更新时间:2024-05-17 02:12

在终端里pip install安装了新包,导致更新了pandas的版本。如何重置为平台初始的版本?

如何恢复平台初始时安装的各个包的版本?

更新时间:2024-02-21 03:59

性能告警cannot map directly to c-types

请问:在回测时报性能告警,是什么原因,如何避免?

/usr/local/python3/lib/python3.8/site-packages/pandas/core/generic.py:2605: PerformanceWarning:

your performance may suffer as PyTables will pickle object types that it cannot

map directly to c-types [inferred_type->mixed,key->block3_values] [items->Index(['instrument

更新时间:2024-01-16 09:57

新版的stockranker DAI如何固化模型

如结果为m5.stockRanker(DAI)

用m5.model获取DataSource

import pandas as pd
pd.DataFrame([DataSource("datasource的name").read()]).to_pickle('/home/bigquant/work/userlib/model.csv') 

再在自定义python模块中输入以下内容是吗

def bigquant_run(input_1, input_2, input_3):
    data = pd.read_pickle('/home/

更新时间:2024-01-11 07:52

提交任务报错:ValueError: NaTType does not support strftime

执行不报错,但是提交任务报错。麻烦工程师小哥看一下什么问题 ?

https://bigquant.com/codeshare/222f36b9-2f22-48aa-88b6-04d9791ec1d7



![](/wiki/api/attachments.redirect?id=18621c

更新时间:2023-12-22 07:02

pandas 的排序问题

问题

pandas 的排序问题,用了排序函数后仍然是乱序 排序函数在m14中,有问题的是对double_low 排序

https://bigquant.com/experimentshare/dd75a98a618044a9ae97fee56dd56f5e

解答

{w:100}

更新时间:2023-10-09 07:41

求问pandas第二表哪儿出现问题

问题

第二个表格生成后,没有

df[(df['price_limit_status']>2)].head(1000) #

选择满足条件的信息的过滤条件了,用那个合并符号试过,但是结果都是显示无效,求帮忙指出如何编辑才能让第二表的两个条件都能实现!

策略

https://bigquant.com/experimentshare/f6b17a8be07f4bd18e930db0167a593d

\

更新时间:2023-10-09 07:39

NaTType does not support strftime

根据视频4.1.3可视化模块操作,提示这个报错,对于表字段的提取,应该最后加什么模块来展现或者输出数据呢?

{w:100}

更新时间:2023-10-09 07:22

WorldQuant Alpha101因子 附录四:对Alpha101因子的因子分析示例(以Alpha#100为例)

Step 1 导入相关包

import pandas as pd 
import numpy as np
import warnings
import empyrical
import dai
import bigcharts
warnings.filterwarnings('ignore')
from biglearning.api import tools as T
print('导入包完成!')

Step 2 读取因子数据、设置因子分析参数并进行因子数据预处理

params = {'gr

更新时间:2023-08-21 11:08

KeyError: "None of [Index(['relative_ret_30', 'relative_ret_5', 'relative_ret'], dtype='object')] a

问题

问题描述

KeyError: "None of [Index(['relative_ret_30', 'relative_ret_5', 'relative_ret'], dtype='object')] a,怎么解决

问题策略

https://bigquant.com/experimentshare/45b6df2e1f684bc69fde21a5985f0f63

\

更新时间:2023-06-01 14:26

报错:'NoneType' object is not subscriptable

克隆了原来的 【研究】隐马尔科夫模型(HMM)的择时应用 只是在原来的基础上调整了取数的周期,策略代码如下:

from hmmlearn.hmm import GaussianHMM import datetime import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from matplotlib import cm from matplotlib import pyplot

读取沪深300历史数据

df = DataSource('bar1d_C

更新时间:2023-06-01 02:13

pandas怎么实现两个条件同时生效

问题

在看了平台好几篇pandas的文章,想问下,两个条子同时生效要怎么做?不是合并这一类的,就是单纯的两个条件同时起作用,例如文章里面的出现的两个

#列名修改

df_test = df[:6] #取局部数据作练习 df_test.columns = ['列%s' % str(i) for i in range(1,len(df_test.columns)+1)]

#更改所有的列名 df_test

#数据过滤

df[(df['fs_roe']>1) & (df['company_type'] != '地方国有企业')].head()

#选择满足多种条件的

更新时间:2023-06-01 02:13

ValueError: cannot reindex from a duplicate axis

问题

问题描述

<ValueError: cannot reindex from a duplicate axis>,如何解决

问题截图

{w:100}{w:100} {w:100}{w:100}

更新时间:2023-06-01 02:13

如何在模拟交易中读取自己上传的数据?

问题

我在策略平台上先导入了一个.csv文件,然后在代码框中可以直接用pandas读取该文件,最后跑出的结果也可以,但是当我把该策略代码开始模拟交易的时候,发现代码出现错误,上面显示读取不出该.csv文件,不知道有什么方法,可以导入进来,再模拟交易中也能跑

更新时间:2023-06-01 02:13

这个代码为什么无法设置初始资金?

导入必要的库 import numpy as np import pandas as pd import talib as ta from scipy import stats from sklearn.manifold import MDS from scipy.cluster import hierarchy

初始化函数,设置要操作的股票池、基准等等 def initialize(context):

设置要交易的股票池,这里以沪深300指数成份股为例

context.stock_pool = index_components('[000300.SH](http://000300.

更新时间:2023-04-10 10:57

DataSource怎么转成pandas的DataFrame呢?

问题

想拿DataSource的列名, 最好能转成pandas的DataFrame

解答

DataSource(表名).read()返回的数据格式就是dataframe

更新时间:2022-12-20 14:20

金工研究:华泰人工智能系列之七-人工智能选股之Python实战-华泰证券-20170912

摘要

介绍Python安装方法、与机器学习相关的包以及常用命令

Python语言是目前机器学习领域使用最广泛的编程语言之一,拥有众多优秀的包和模块,并且相对简单易学。我们将简单介绍Python语言的特性,常用命令,以及和机器学习相关的包,例如NumPy,pandas,scikit-learn等,希望帮助有一定编程基础的读者迅速上手Python语言。

机器学习选股框架与多因子选股框架类似,具有一定优越性

机器学习中最为主流的方法监督学习,其核心思想是挖掘自变量和因变量之间的规律。我们将经典多因子模型稍加改造,以机器学习的语言描述。在训练阶段,根据历史的因子值X和收益

更新时间:2021-11-26 07:28

分页第1页
{link}