量化交易 实战第六课 市值中性化选股
- 概述
- 代码实现
概述
本篇我们会利用我们之学到的因子数据处理的技术来实现一个市值中性化选股的策略.
代码实现
# 可以自己import我们平台支持的第三方python模块,比如pandas、numpy等。
# 1. 获取市值和市净率因子数据
# 因子: 极值, 标准化, 中性化处理
# 2. 选定股票池 (根据方向权重)
# 市净率小的某些股票
from sklearn.linear_model import LinearRegression# 在这个方法中编写任何的初始化逻辑。context对象将会在你的算法策略的任何方法之间做传递。
def init(context):scheduler.run_weekly(get_data, tradingday=1)scheduler.run_weekly(trade, tradingday=1)def get_data(context, bar_dict):# 查询两个因子的整数结果q = query(fundamentals.eod_derivative_indicator.pb_ratio,fundamentals.eod_derivative_indicator.market_cap).order_by(fundamentals.eod_derivative_indicator.pb_ratio)fund = get_fundamentals(q)# 转置context.fund = fund.T# 查看fund格式# logger.info(fund.T)# 进行因子数据的处理, 去极值, 标准化treat_data(context)# 利用市净率进行选股 (市净率小的表现好)context.stock_list = context.fund["pb_ratio"][context.fund["pb_ratio"] <= context.fund["pb_ratio"].quantile(0.05) # 取前5%].index# 调试输出logger.info(context.stock_list)logger.info(context.stock_list.shape)def treat_data(context):"""因子数据的处理逻辑"""# 去除NaNcontext.fund = context.fund.dropna()# 对市净率去极极值标准化context.fund["pb_ratio"] = mad(context.fund["pb_ratio"])context.fund["pb_ratio"] = stand(context.fund["pb_ratio"])# 调试输出logger.info(context.fund.shape)# 选股的处理, 对市净率进行市值中性化# 特征值: 市值# 目标值: 市净率因子x = context.fund["market_cap"].values.reshape(-1, 1)y = context.fund["pb_ratio"]# 建立线性回归, 中性化处理lr = LinearRegression()lr.fit(x, y)y_predict = lr.predict(x)# 去除残差context.fund["pb_ratio"] = y - y_predict# before_trading此函数会在每天策略交易开始前被调用,当天只会被调用一次
def before_trading(context):pass# 你选择的证券的数据更新将会触发此段逻辑,例如日或分钟历史数据切片或者是实时数据切片更新
def handle_bar(context, bar_dict):# TODO: 开始编写你的算法吧!pass# after_trading函数会在每天交易结束后被调用,当天只会被调用一次
def after_trading(context):passdef trade(context, bar_dict):# ----------------卖出----------------for stock in context.portfolio.positions.keys():# 判断是否还在股票池if stock not in context.stock_list:order_target_percent(stock, 0)# ----------------买入-----------------weight = 1.0 / len(context.stock_list)for stock in context.stock_list:order_target_percent(stock, weight)# 绝对偏差
import numpy as npdef mad(factor):"""3倍中位数去极值"""# 求出因子值的中位数med = np.median(factor)# 求出因子值与中位数的差值, 进行绝对值mad = np.median(abs(factor - med))# 定义几倍的中位数上下限high = med + (3 * 1.4826 * mad)low = med - (3 * 1.4826 * mad)# 替换上下限以外的值factor = np.where(factor > high, high, factor)factor = np.where(factor < low, low, factor)return factor# 标准化def stand(factor):"""自实现标准化"""mean = factor.mean()std = factor.std()return (factor - mean) / std
输出结果: