本文提出了一种三层次的中文段落级主题结构表示方法,并基于此构建了最大规模和高质量的中文段落级主题结构语料库(CPTS)。同时,我们在CPTS上构建了多个强基线模型,验证了其在主题分割和大纲生成任务上的可计算性,并初步证明了其在下游任务(如话语分析)中的有用性。