1. 程式人生 > >小白自學量化交易之萬礦課程筆記---股票多因子策略初階

小白自學量化交易之萬礦課程筆記---股票多因子策略初階

pandas.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None
, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression=
'infer', thousands=None, decimal=b'.', lineterminator=None, quotechar='"', quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, doublequote=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=
None)
  • pandas.read_cav( ‘file_name’,index_col=None)

index_col : int or sequence or False, default None
Column to use as the row labels of the DataFrame. If a sequence is given, a MultiIndex is used. If you have a malformed file with delimiters at the end of each line, you might consider index_col=False to force pandas to _not_ use the first column as the index (row names)

簡書3230

用作行索引的列編號或者列名;取值可以有整數、序列、False、None;

如果給定一個序列(sequance),則採用多級索引(multiindex);

index_col=[0,1]指定檔案的第一、二列為索引列。

在這裡插入圖片描述

在這裡插入圖片描述

在這裡插入圖片描述

在這裡插入圖片描述

  • Multiindex

表示多級索引,index的多層形式,多級標籤用字典來表示。詳解1 詳解2

  • DataFrame_name.get_lever_values(level)

多級索引前提下,獲取level級索引下的返回向量。標準文件 IT邦

在這裡插入圖片描述

numpy.unique(ar, return_index=False, return_inverse=False, return_counts=False, axis=None)

表示對陣列或列表去重,return_index=True表示返回去重後元素在原陣列中所佔的位置。

  • 去極值和標準化

去掉噪音,避免對因子的整體分佈造成影響。有兩種:平均絕對離差法(MAD:MeanAbsoluteDeviation,以均值+n*MAD為邊界)、標準差法(Std)。

完成去極值後再對資料進行標準化,實現量綱一致,有普通標準化和行業標準化。

  • 函式列表

wa.prepare_raw_data() 獲取原始因子資料
wa.process_raw_data() 資料處理
wa.ic_analysis() 因子分析
wa.add_group() 分組函式
wa.return_anlysis() 收益率分析函式
wa.turnover_analysis() 換手率分析
wa.sector_analysis() 選股結果分析函式
  • 概念羅列

IC:當期因子值與下一期收益率之間的相關性,相差一個週期。

IC訊號衰減:當前因子與相差LAG期收益率之間的相關性。

LAG:

因子分析-換手率分析:

------------------------------->個數法:每期之間股票變動的數量/股票總數。

------------------------------->權重法:在個數考量的基礎上,考慮了權重。

買入訊號衰減:已買入的股票在後續調倉中繼續買入的比率。

買入訊號反轉:當前買入的股票在後續調倉期賣出的比率。

未完待續…