NLP中的数据增强方法!

🥈个人主页: 今天给大家带来的刷题系列是:NLP中的数据增强方法!

当训练数据量不充分,或者分布单一的情况下,数据增强可以快速扩充语料以避免过拟合的问题。同时,数据增强也可以提升模型的鲁棒性,避免微弱的变化使得模型无法泛化到相似的语境中。

    机器学习和深度学习在包括文本分类等自然语言任务达到不错的效果,但他们 需要依赖于大规模的标注数据 ,除了直接使用小样本学习外,显式数据增强格外有效; 数据增强在计算机视觉中得以应用,其可以在数据量很少的情况下提升模型的鲁棒性;而在NLP中,通用的文本类型的数据增强 还没有完全被挖掘出来 ;

本文介绍几种比较简单但常用的NLP数据增强方法,包括显式和隐式两个方面,在实验或比赛中可以提升效果。可使用nlpaug[1]工具快速实现这些技术。

经验分享 程序员 微信小程序 职场和发展