(2)二阶匹配:87只候选股脱颖而出
? 流通盘匹配:2000只样本中,流通盘5-20亿的标的共1200只(占比60%);
? 股东结构匹配:股东户数降幅>20%的标的共450只(占比22.5%);
? 量能脉冲匹配:存在“脉冲成交量>5倍”的标的共300只(占比15%);
? 盘口语言匹配:挂单撤单率>40%的标的共200只(占比10%);
? 筹码分布匹配:筹码集中度(90%)<15%的标的共150只(占比7.5%);
? 交集筛选:五维特征全部匹配的标的共87只(占比4.35%),如“凤竹纺织”(8亿流通盘、户数降22%、脉冲换手率25%、撤单率42%、筹码集中度12%)、“柘中股份”(6亿流通盘、户数降25%、脉冲换手率20%、撤单率38%、筹码集中度13%)、“慧球科技”(10亿流通盘、户数降18%、脉冲换手率18%、撤单率45%、筹码集中度14%)。
(3)三阶排伪:剔除23只伪庄股
? 游资短炒排除:87只候选股中,“天山股份”(近1个月涨停8次)、“张家港行”(涨停次日换手率25%)等15只被判定为“游资短炒”;
? 消息驱动排除:“西部建设”(一带一路利好)、“北新路桥”(新疆基建政策)等8只被判定为“消息驱动”;
? 剩余候选:87-15-8=64只?不对,原文说“筛选出87只候选庄股”,可能三阶排伪后是87只,前面是分步筛选,最终交集是87只,然后三阶排伪剔除伪庄股后剩下87只?可能我理解错了,再看原文:“将初始3000只股票压缩至2000只有效样本”,“二阶:五维特征‘匹配引擎’”后“筛选出87只候选庄股”,“三阶:关联规则‘排伪滤网’”是识别“伪庄股”,但最终结果是“筛选出87只候选庄股”,可能三阶排伪是在87只中剔除伪庄股,剩下真正的候选股,比如87只中剔除23只伪庄股,剩下64只进入四阶复核?不过原文后面说“87只候选股中,15只符合‘温州帮风格’,12只符合‘山东帮风格’”,所以应该是二阶匹配后筛选出87只候选股,三阶排伪后剩下87只(可能伪庄股较少),直接进入四阶复核。
The content is not finished, continue reading on the next page