行业报告 AI展会 数据标注 标注供求
数据标注数据集
您的当前位置:主页 > 数据下载 > 文本语料 > 正文

JRC Names 实体专有名词库

时间:2019-08-15
数据类型:文本语料 热度
★★★☆☆

文件类型: .zip              文件大小:756 MB

授权方式: 其它     发布时间:2019-08-15

数据来源:欧盟科学中心             界面语言:英文

数据介绍:
什么是JRC名称?
JRC-Names是一个高度多语言的命名实体资源,用于个人和组织名称(称为“实体”)。它包含大量名称列表及其多种拼写变体(单个人最多可达数百种),包括跨脚本(拉丁语,希腊语,阿拉伯语,西里尔语,日语,中文等)。自2016年3月起,JRC-Names也可作为链接数据提供,包括其他信息,如每种语言的频率,与实体一起找到的标题以及日期范围。
 
JRC名称可以用于什么?
JRC-Names是一种技术资源,可用于查找名称,即使它们拼写不同,但它也是处理文本的IT系统的有用组成部分,例如用于文本挖掘。
 
JRC名称是如何产生的?
JRC-Names是欧洲媒体监视器(EMM)系列应用程序每天分析约220,000条新闻报道的副产品。
 
JRC名称统计
JRC-Names包含EMM名称数据库的最重要名称,即经常找到的或者在Wikipedia上手动验证或找到的名称。
本文来自可思数据(sykv.com),转载请联系本站及注明出处





下载地址:

特别声明:

¤ 此数据集库仅供研究和教育用途,不得用于任何商业用途。
¤ 如果您在任何出版物或报告中使用该数据库,则必须添加引用来源。
¤ 版权归作者及所在组织所有。
¤ 如用于商业用途,请联系版权所有人。
¤ 本站数据来源于网络如有侵权请联系我们。
转发量:


人工智能交流群扫码邀请
人工智能交流群扫码邀请

网友评论:

发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片

Copyright©2005-2026 Sykv.com 可思数据 版权所有    京ICP备14056871号

关于我们   免责声明   广告合作   版权声明   联系我们   原创投稿   网站地图  

可思数据 数据标注行业联盟

扫码入群
扫码关注

微信公众号

返回顶部
扫码入群
咨询反馈
扫码关注

微信公众号

返回顶部