SeniorTalk数据集是全球首个专门面向超高龄老年人的中文对话语料库,包含202位75岁及以上老人的55.53小时语音,覆盖全国16个省市。数据采集采用两两自由对话方式,涵盖退休、健康、生活等真实话题,并包含丰富的语音标注信息。实验分析显示,超高龄老人的语音存在发音虚弱、方言固化、语言组织能力下降等特征,这些数据将有助于优化老年人语音交互系统,推动适老化技术和智能养老产业发展。