返回

第163章 模型初建

首页
关灯
护眼
字:
上一页 回目录 下一页 进书架
    第163章 模型初建 (第2/3页)

类似的思路,计算其相对于近期滚动窗口内均值(或中位数)的偏离倍数。

    处理后的因子,变成了一个个无量纲的、可比的、反映“偏离正常程度”的数值。

    ------

    第二步:因子分类与情绪维度映射

    接下来,他将预处理后的几十个因子,按照其反映的情绪倾向,分为两大类:

    • 正向情绪因子: 当该因子值“异常高”时,通常对应市场情绪偏向贪婪、乐观、亢奋。例如:上涨家数比例(Z-Score高)、涨停家数(偏离倍数高)、融资买入占比(Z-Score高)、新闻积极情感比例(Z-Score高)、论坛“牛市”、“涨停”等贪婪关键词频率(Z-Score高)。

    • 负向情绪因子: 当该因子值“异常高”时,通常对应市场情绪偏向恐惧、悲观、绝望。例如:下跌家数比例(Z-Score高)、跌停家数(偏离倍数高)、波动率(Z-Score高)、股指期货贴水幅度(Z-Score高,贴水为负值,但幅度大视为Z-Score高)、新闻消极情感比例(Z-Score高)、论坛“割肉”、“熊市”等恐慌关键词频率(Z-Score高)。

    同时,他意识到,情绪并非简单的“贪婪-恐惧”一维光谱,而是一个多维结构。例如,市场可能在“贪婪”的同时伴随着“高波动”(不安的贪婪),或者在“恐惧”中蕴含着“抄底”的暗流(试探性的恐惧)。因此,他初步构想将情绪分解为几个核心“维度”:

    1. 乐观/悲观维度: 主要由价量广度、涨跌停、新闻情感、论坛主题倾向等因子决定。反映市场对未来的普遍看法。

    2. 亢奋/恐慌维度: 主要由波动率、极端价格行为、融资盘变化、期权隐含波动率(如有)、论坛恐慌/贪婪关键词的激烈程度等因子决定。反映市场情绪的激烈程度和一致性。

    3. 风险偏好维度: 主要由资金流向(大小单差异、板块轮动)、股指期货升贴水、新股表现等因子决定。反映资金是追逐**险资产还是寻求避险。

    4. 参与热度维度: 主要由成交量变化、换手率、论坛讨论热度、搜索指数等因子决定。反映市场整体关注度和交易活跃度。

    每个维度,将由属于该维度的一组正、负向因子综合计算得出。这为后续的情绪结构分析奠定了基础。

    ------

    第三步:权重确定与指数合成

    这是模型构建的核心与难点。如何给不同的因子分配合适的权重?简单等权平均显然不合理,因为不同因子对市场情绪的表征能力和可靠性天差地别。

    陆孤影采用了“主客观结合,动态调整”的方法。

    首先,主观赋予初始权重。 基于他对市场的理解和历史经验,他给不同大类的数据源分配基础权重。例如,他认为交易数据(价、量、资金)是情绪最直接、最不可伪造的体现,给予最高权重(比如40%)。衍生品与信用数据(期指、融资融券)代表了“聪明钱”和杠杆资金的预期,具有前瞻性,给予较高权重(25%)。舆情数据(新闻、论坛)反映了市场叙事和散户情绪,但噪音较大,且可能具有误导性,给予中等权重(20%)。调查与宏观数据(基金仓位、IPO等)频率低且滞后,但提供了机构行为的侧面印证,给予较低权重(15%)。在每个大类内部,再对具体因子进行细分赋权。例如,在交易数据中,市场广度(上涨家数比)的权重可能高于单一指数的涨跌幅。

    然后,引入统计验证进行动态微调。 他利用过去几年的历史数据(回测),尝试找出在历史重要市场顶部和底部区域(这些区域的市场情绪特征相对公认,如2015年牛市顶部、2018年底部、2020年疫情底等),哪些因子的Z-Score表现最为极端和一致,哪些因子的拐点更为领先。通过这种“历史极端情绪场景下的因子表现分析”,来验证和调整初始权重。例如,他发现,在市场极度恐慌的底部,论坛恐慌关键词的爆发性增长和股指期货的深度贴水,往往比简单的涨跌家数更为敏感和领先。那

    (本章未完,请点击下一页继续阅读)
上一页 回目录 下一页 存书签