打工e族

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 95|回复: 0

计算语言学的现状

[复制链接]

1

主题

1

帖子

5

积分

初入职场

Rank: 1

积分
5
发表于 2024-1-17 12:59:14 | 显示全部楼层 |阅读模式

人工智能的一些最新发展涉及计算语言学。因此,有必要了解该学科及其行动领域正在发生的事情,以推动语言技术领域在数字社会中发挥越来越大的潜力。 由巴勃罗·加西亚·梅西亚 (Pablo García Mexía) 主管、法律出版商 RDU 编辑的《隐私与数字法期刊》( Journal of Privacy and Digital Law) 在最新一期发表了一份关于计算语言学和语言技术现状的研究报告,署名是计算语言学研究所的计算语言学家卡门·托里霍斯 ( Carmen Torrijos)。知识工程(IIC)。 本文向专门研究数字法的读者介绍了计算语言学作为一门学科,他们不太熟悉最新的语言技术,但对数据科学和人工智能的进步越来越感兴趣。 计算语言学简介和语言处理的基本阶段 文章回顾了自然语言处理(NLP)的现状,主要是在西班牙,总结了该学科近年来的技术进展。这是计算语言学的主要活动。PLN 在第一章中,我们首先回顾该学科的历史,然后对语言处理提出第一种方法论。 第一章简要介绍了作为理论语言学和计算机科学的混合体的计算语言学的概念。重点介绍了该学科发展中的某些里程碑,从 20 世纪 60 年代的诞生到最近被纳入西班牙技术能力地图。

第二章介绍自动语言处理的基本阶段:将文本划分为完整的句子、分离为单 塞内加尔电话号码表 词或标记化、词形还原、形态注释、句法注释和计算语法。它还描述了称为解析器的语言分析工具和规则系统的操作,这些工具传统上以管道的形式配置,其中前一个过程的输出是下一个过程的输入,直到实现完整的分析。一旦克服了这些阶段,我们就可以深入研究语义的形式编码。 机器学习和语言模型 接下来,本文重点介绍可让您训练模型和推断语言模式的机器学习技术。使用语料库或文本集,在某些情况下,使用其详尽的注释,机器学习模型可以以更高的精度处理语言。计算语言学新闻第三章介绍了语料库的概念、语料库选择和设计作为任何 NLP 项目基础的重要性及其基本特征:完整、代表性、随机和平衡。作为机器学习过程的基本部分,成对注释方法被深入描述,它包括创建注释语料库,以训练检测某些语言现象的监督学习模型。 第四章深入研究最先进的 NLP 技术,例如无监督语言模型和词向量化(嵌入)。近年来,各种经典任务的最新技术已被高性能无监督模型(例如 BERT 模型)和不同监督模型的组合所超越,这些监督模型执行专门的微调,以提高模型的效率。在它必须执行的任务中。语言模型在嵌入中存储上下文信息的能力正在增强,这导致了自然语言理解领域的巨大进步。



NLP 任务和技术团队中计算语言学家的概况 语言技术在不同领域有多种应用,因此在我们的日常生活中也有多种应用。随着人们对其有用性的认识不断增长,需求也在增长,这使得有必要关注计算语言学家的培训及其在技术团队中占据的地位。 PLN第五章分析了目前企业和机构最需要的NLP应用是什么以及它们的组成,例如情感分析、海量文本分类、自动翻译或自动回答问题。 这些任务的描述及其营销也有助于反思“理解”或“学习”在机器领域的含义,这些隐喻是我们与人类认知过程进行类比时使用的。 最后,回顾了计算语言学家的普遍人文起源及其作为混合概况的科学训练、本科和硕士水平的大学培训的最新变化、进入劳动力市场以及这些新专业人员在多学科团队中的整合。与软件分析师、开发人员、数据科学家和工程师一起。 整篇文章都解释了计算语言学在数字社会中的重要性,但它只是众多传统学科之一,它将与新技术相结合,为人类提供我们之前无法提取的数据、结论和现实。数字革命。 文本分析算法以及其他成就正在让社会通过自己的书面数据重新评估自己的偏见。鉴于这些新的推动力,我们可以说,几年前计算语言学这门几乎不为少数人所知的混合学科正在成为数字发展的旗舰之一。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|打工e族 ( 鲁ICP备2021044221号 )

GMT+8, 2024-11-24 09:48 , Processed in 0.050693 second(s), 19 queries .

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表