金融界2025年5月31日消息,国家知识产权局信息显示,深圳力维智联技术有限公司申请一项名为“基于未标注数据的词嵌入模型训练方法、装置、设备和存储介质”的专利,公开号CN120067293A,申请日期为2025年01月。
专利摘要显示,本申请公开了一种基于未标注数据的词嵌入模型训练方法、装置、设备和存储介质,涉及自然语言处理技术领域,所述基于未标注数据的词嵌入模型训练方法包括获取初始数据和初始词嵌入模型;根据所述初始词嵌入模型对所述初始数据进行向量表示,得到向量数据库;基于所述向量数据库进行相似度筛选,得到目标样本数据;通过所述目标样本数据对所述初始词嵌入模型进行训练,得到目标词嵌入模型。本申请通过从未标注数据中有效选择具有挑战性的难负例进行训练,显著提升了词嵌入模型的学习效果。它减少了对人工标注数据的依赖,降低了数据标注成本,同时增强了模型对复杂样本的学习能力和对未知数据的适应性,从而提高了模型的泛化性能和鲁棒性。
天眼查资料显示,深圳力维智联技术有限公司,成立于2005年,位于深圳市,是一家以从事计算机、通信和其他电子设备制造业为主的企业。企业注册资本12183.33万人民币。通过天眼查大数据分析,深圳力维智联技术有限公司共对外投资了6家企业,参与招投标项目1614次,财产线索方面有商标信息57条,专利信息481条,此外企业还拥有行政许可27个。
来源:金融界