您当前的位置: > 详细浏览

基于文本数据增强的生活满意度预测模型优化

请选择邀稿期刊:

Optimization of a prediction model of life satisfaction based on text data augmentation

摘要: 目的 随着网络大数据以及机器学习的方法的发展,越来越多研究结合文本分析与机器学习来预测满意度。在建立生活满意度预测模型的研究中,针对获取大量有效的有标注数据困难的问题,本研究提出基于文本数据增强以优化生活满意度预测模型。 方法 改编大连理工词典后,以357份生活现状描述为原始文本、生活满意度量表自评分为标注,经过EDA和回译进行文本数据增强,利用传统机器学习算法建立预测模型。 结果 结果显示,大连理工词典改编后,各模型预测能力大大提高;数据增强后,仅在线性回归模型上观察到回译和EDA的提升作用。使用原始数据进行训练的岭回归模型预测值与实际值的皮尔逊相关系数最高,达0.4131。 结论 特征提取精度的提升可优化目前的生活满意度预测模型,但对于以词频为特征建立的生活满意度预测模型,基于回译和EDA进行的文本数据增强可能并不十分适用。

版本历史

[V2] 2024-02-29 13:31:45 ChinaXiv:202201.00007V2 下载全文
[V1] 2022-01-04 11:07:49 ChinaXiv:202201.00007v1 查看此版本 下载全文
点击下载全文
预览
同行评议状态
待评议
许可声明
metrics指标
  •  点击量6147
  •  下载量509
评论
分享
申请专家评阅
  • 运营单位: 中国科学院文献情报中心
  • 制作维护:中国科学院文献情报中心知识系统部
  • 邮箱: eprint@mail.las.ac.cn
  • 地址:北京中关村北四环西路33号
招募志愿者 许可声明 法律声明

京ICP备05002861号-25 | 京公网安备11010802041489号
版权所有© 2016 中国科学院文献情报中心