语料库定义

翻译百科|《中国大百科全书》中的“平行语料库

关于平行语料库定义一直存在分歧。S.约翰松认为平行语料库是收录具有可比关系的两种语言文本的语料库,而M.贝克则主张平行语料库收录的文本是A语言文本及其B语言译本。较之于前者,后者更被学界接受。学界普遍认为平行语料库...

直播预告|11月23日“博雅大学堂”云课程:语料库技术与翻译运用

语料库定义、类型及功用 常用语料库创建方法 语料库分析软件在翻译中的运用 在线语料库在翻译中的运用 语料库在翻译中的运用、展望 05 参与方式 06 推荐阅读 书名:翻译技术实践教程 定价:68 元 作者:戴光荣 出版社:北京...

三分钟科普,语料库初探

英国兰卡斯特大学的 Tony McEnery 教授是国际语料库语言学界的代表性学者,他在 Corpus-based Language Studies:An Advanced Resource Book 一书中对语料库有如下定义: A collection of machine-readable,authentic texts...

讲座回顾|中山大学国际翻译学院“世纪中大·百年外语·逸仙三人行”线上系列讲座(第二期)成功举办_语料库

在此基础上,语料库批评翻译学得以最终形成。接下来胡教授从语料库批评翻译学的“界定”、“边界”和“维度”三个方面回答了以下三个问题:1)什么是语料库批评翻译学?其本质属性是什么?2)语料库批评翻译学与基于语料库的翻译...

一篇文章教你建立自己的语料库

语料库语言学家辛克莱将其定义为“按照一定的采样标准采集而来的、能够代表一种语言或某语言的一种变体或文类的电子文本”。二、如何建立语料库1.语料收集整理语料通常都会以txt格式保存。如果是书面语料,需要先扫描将其转成...

OpenAI 与开源多语言嵌入模型对比_语料库_数据_性能

从多语言本语料库中生成自定义合成问题/答案数据集 比较 OpenAI 和最先进的开源嵌入模型在该自定义数据集上的准确性。用于重现本篇文章中介绍的结果的代码和数据可在此 Github 存储中获取。请注意,本文以《欧盟人工智能法案...

OpenAI与开源多语言嵌入模型,你选择哪一家?数据_语料库_https

从多语言文本语料库生成自定义合成问答数据集;在这个自定义数据集上比较OpenAI和当今最先进的开源嵌入模型的准确性。在Github存储(https://github.com/Yannael/multilingual-embeddings)中提供了重现本文中呈现的所有结果...

训练大模型要小心什么?这场研讨会热议AI语料建设与合规|语料库|人工智能_网易订阅

培育适应生成式人工智能环境下尊重版权的文化氛围,深入研究和严格定义生成式文本与人类知识生产的异同。语料建设及数据获取需遵循法律规范 此次研讨会上,专家一致认为数据获取、语料建设需要遵循相关法规、标准和规范,要...

尤 易 曹贤文|20 年来国内外学习者语料库建设及应用研究分析_检索_文献_数据

根据《剑桥学习者语料库研究手册》的定义,学习者语料库是“按照明确的设计标准收集汇编的,由外语或二语学习者产出的自然数据或近乎自然数据的电子集合”(Granger 等,2015)。冯志伟(霍斯顿,2006)指出:“语料库的使用…...

一篇文章教你如何建立自己的语料库|翻译|汉语|笔译|语言学_网易订阅

语料库语言学家辛克莱将其定义为“按照一定的采样标准采集而来的、能够代表一种语言或某语言的一种变体或文类的电子文本”。二、如何建立语料库"Type="normal"@-> 1.语料收集整理 语料通常都会以txt格式保存。如果是书面语料,...