本研究通过对中文短文本匹配任务的实验分析,探讨了大规模语言模型在有监督微调中的有效性,包括任务建模方法、提示格式和思维链等因素的影响。结果表明,生成式范式优于判别式方法,尤其在训练数据有限的情况下;提示格式对有监督的大规模语言模型影响较小;而思维链可以提升模型在困难任务上的性能。