基于文本数据增强的生活满意度预测模型优化

Optimization of a prediction model of life satisfaction based on text data augmentation

作者： 陈佳婧 ^1,2 胡丁鼎 ^1,2 宋蕊 ^1,2 谭诗奇 ^1,2 李雨晴 ^1,2 张胜楠 ^1,2 朱廷劭 ^1,2 赵楠 ^1,2
作者单位：

1. 中国科学院心理研究所，北京，100101

2. 中国科学院大学心理学系, 北京 100049
通讯作者： 朱廷劭 Email:tszhu@psych.ac.cn 赵楠
提交时间：2024-02-29 13:31:45

摘要: 目的随着网络大数据以及机器学习的方法的发展，越来越多研究结合文本分析与机器学习来预测满意度。在建立生活满意度预测模型的研究中，针对获取大量有效的有标注数据困难的问题，本研究提出基于文本数据增强以优化生活满意度预测模型。方法改编大连理工词典后，以357份生活现状描述为原始文本、生活满意度量表自评分为标注，经过EDA和回译进行文本数据增强，利用传统机器学习算法建立预测模型。结果结果显示，大连理工词典改编后，各模型预测能力大大提高；数据增强后，仅在线性回归模型上观察到回译和EDA的提升作用。使用原始数据进行训练的岭回归模型预测值与实际值的皮尔逊相关系数最高，达0.4131。结论特征提取精度的提升可优化目前的生活满意度预测模型，但对于以词频为特征建立的生活满意度预测模型，基于回译和EDA进行的文本数据增强可能并不十分适用。

生活满意度大连理工词典文本数据增强回译 EDA 机器学习

来自： 朱廷劭
分类： 心理学 >> 应用心理学计算机科学 >> 计算机应用技术
投稿状态： 未投稿
引用： ChinaXiv:202201.00007 (或此版本 ChinaXiv:202201.00007V2)
DOI:10.12074/202201.00007V2
CSTR:32003.36.ChinaXiv.202201.00007.V2
推荐引用方式： 陈佳婧,胡丁鼎,宋蕊,谭诗奇,李雨晴,张胜楠,朱廷劭,赵楠.(2024).基于文本数据增强的生活满意度预测模型优化.中国心理学预印本平台.doi:10.12074/202201.00007V2 (点此复制)

版本历史

[V2]	2024-02-29 13:31:45	ChinaXiv:202201.00007V2	下载全文
[V1]	2022-01-04 11:07:49	ChinaXiv:202201.00007v1 查看此版本	下载全文

相关论文推荐

1. 恶意代码SCMP分类方法框架与风险行为多标签机制	2024-05-09
2. 引导大语言模型生成计算机可解析内容	2024-04-21
3. 基于大语言模型的中英文整合复杂性建模研究	2024-04-10
4. 大模型与标准文献知识库的融合应用探索	2024-04-10
5. 简体中文LIWC2024(SCLIWC2024)词典的修订与验证	2024-04-09
6. 引导大语言模型生成计算机可解析内容	2024-04-07
7. 基于 Python 中 MeCab 库对日语文章进行文本分析处理实现	2024-04-04
8. 一种基于能量-信息转换的智能测度	2024-03-30
9. 基于大语言模型的中庸思维对心理健康的影响机制研究——道德中心性的中介作用	2024-03-23
10. 收入分配不平等对心理健康的影响机制研究——道德中心性的中介作用	2024-03-23


公开评论匿名评论仅发给作者