对外汉语语料库有哪些_国内语料库建设一览表

英语学习者语料库(书面语及口语)中国学习者语料库 CLEC(100万)广外、上海交大

大学英语学习者口语语料库 COLSEC (5万) 上海交大

香港科技大学学习者语料库 HKUST Learner Corpus 香港科技大学

中国英语专业语料库 CEME (148万) 南京大学

中国英语学习者口语语料库 SECCL (100万) 南京大学

国际外语学习者英语口语语料库中国部分 LINSEI-China (10万) 华南师大

硕士写作语料库 MWC (12万) 华中科技大学

平行语料库 汉英平行语料库 PCCE 北外

南大-国关平行语料库 南京大学

英汉文学作品语料库; 外研社

冯友兰《中国哲学史》汉英对照语料库

李约瑟(Joself Needham)《中国科学技术史》英汉对照语料库

计算机专业的双语语料库;国家语言文字工作委员会语言文字应用研究所

柏拉图(Plato)哲学名著《理想国》的双语语料库

英汉双语语料库(15万对) 中科院软件所

英汉双语语料库:LDC香港新闻英汉双语对齐语料36294段以及香港法律英汉双语对齐语料31万句子对中国科学院自动化研究所

英汉双语语料库(100万),网上英汉语段电子词典及网上电子英汉搭配词典(1000万) 东北大学

英汉双语语料库(40-50万句子对) 哈尔滨工业大学

双语语料库(5万多对) 北京大学计算语言学研究所

对比语料库 LIVAC(Linguistic variety in Chinese communities)

香港城市理工大学

平衡语料库(Sinica Corpus);树图语料库(Sinica Treebank) 台湾

特殊英语语料库 中国英语(China English)语料库河南师范大学

军事英语语料库(Corpus of Military Texts) 解放军外语学院

新视野大学英语教材语料库 上海交通大学

汉语语料库汉语现代文学作品语料库(1979年,527万字) 武汉大学

现代汉语语料库(1983年,2000万字) 北京航空航天大学

中学语文教材语料库(1983年,106万8000字) 北京师范大学

现代汉语词频统计语料库(1983年,182万字) 北京语言学院

国家级大型汉语均衡语料库(2000万字) 国家语言文字工作委员会

《人民日报》语料库(2700万字) 北京大学计算机语言学研究所

大型中文语料库(5亿字,10分库) 北京语言文化大学

现代汉语语料库(1亿字) 清华大学

汉语新闻语料库;(1988年,250万字) 山西大学

标准语料库(2000年,70万字)

生语料库(3000万字);《作家文摘》的标注语料库(100万字) 上海师范大学

现代自然口语语料库 中国社会科学院语言所

旅游咨询口语对话语料库和旅馆预定口语对话语料库中国科学院自动化所

北京大学汉语语言学研究中心的三个语料库

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/351909.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据库设计(一对一、一对多、多对多)

关联映射:一对多/多对一 存在最普遍的映射关系,简单来讲就如球员与球队的关系; 一对多:从球队角度来说一个球队拥有多个球员 即为一对多 多对一:从球员角度来说多个球员属于一个球队 即为多对一数据表间一对多关系如下…

oozie与hue整合 执行WC案例报错: 连接10020端口被拒绝

Call From hdp-05/192.168.230.15 to hdp-01:10020 failed on connection exception: java.net.ConnectException: 拒绝连接; For more details see: http://wiki.apache.org/hadoop/ConnectionRefused错误原因没有启动hadoop的history程序JobHistoryServer进程监听端口就是10…

matlab无法读取xls

我首先从C中导出了xls格式的excel表格,又用MATLAB读取时,遇到下面的问题: Error using xlsread (line 251) File E:\matlab_pagram\myGMS\right.xls not in Microsoft Excel Format. 我的读取函数是:labels_right xlsread(righ…

Valhalla项目的价值

我对Valhalla项目的进度一直很感兴趣,但是Brian Goetz最近的信息“ Valhalla项目:目标 ”提高了我的兴趣。 我经常喜欢Goetz的作品,因为他结合了我最想成为技术作者的两个特征:他比他所写的内容更了解他所写的主题,而且…

python里clear和copy_python之字典

通过名字引用值得数据结构.这种结构类型称为映射.字典是python中唯一内建的映射类型.字典中的值并没有特殊的顺序,但是都存储在一个特定的键里.键可以是数字,字符串甚至是元组.某些情况下,字典比列表更加适用:1.表征游戏棋盘的状态,每个键都是由坐标值组成的元组;2.存储文件修改…

实用类-会员信息

录入会员生日,形式必须是“月/日”,如“09/12”;录入的密码必须在6-10位之间;允许用户重复输入,直到输入正确为止。 1 package demo3;2 3 import java.util.Scanner;4 5 public class Test8 {6 public static void…

GDAL学习总结

GDAL介绍 GDAL(Geospatial Data Abstraction Library)是一个在X/MIT许可协议下的开源栅格空间数据转换库。它利用抽象数据模型来表达所支持的各种文件格式。它还有一系列命令行工具来进行数据转换和处理。OGR是GDAL项目的一个分支,功能与GDAL类似,只不过…

matlab能用矩阵操作就不要用for循环

1.MATLAB尽量少用for循环来操作矩阵,多用本身的矩阵操作函数 比如,想将矩阵的第三列通过第二列计算得到,以下两种方式得到的结果一致,但不用for更简洁。 a 6; feature_labelnum(:,3) a * sqrt(feature_labelnum(:,2));%第三列…

jsp快到截止日期字体颜色变色_jsp页面中字体变色问题 - Java / Web 开发

jsp页面中字体变色问题 - Java / Web 开发[title]function diyCheck(){var fm document.frmMain;s1fm.YEAR.value;if(s12010){}年 [YEAR]计划 [PLANINOROUT] 问题:当页面中年的值为2009时正常显示,如果年的值为2010时,字体颜色变为红色&…

基于Flask、MySQL和Echarts的*市CPI和物价水平数据可视化分析

基于Flask、MySQL和Echarts的*市CPI和物价水平数据可视化分析 引言: 在当前社会经济背景下,CPI(居民消费价格指数)和物价水平的波动对市场和居民生活产生直接影响。本文将介绍一款基于Flask、MySQL和Echarts的数据可视化系统&…

windows server 2008 iis6.0 无法下载.exe

以下都是我自己的见解,如果有不对的地方,请各位大佬纠正,谢谢。 正常来讲,访问.exe文件,只需要在mini类型添加 application/octet-stream 后缀名 .exe 就可以下载.exe文件的。 这里是我配置了 application/octet-strea…

MATLAB错误:‘conv2’

MATLAB错误 Undefined function conv2 for input arguments of type double and attributes full 3d real. 原因:Color images are 3 dimensional arrays (x,y,color). conv2 is only defined for 2-dimensions, so it wont work directly on a 3-dimensional ar…

抽象工厂模式设计模式_抽象工厂设计模式解释

抽象工厂模式设计模式抽象工厂设计模式是工厂设计模式的另一种形式。 这种模式可以被视为“超级工厂”或“工厂工厂”。 抽象工厂设计模式(属于“四人帮”的一部分)属于“创新设计模式”类别,它提供了一种方法来封装一组具有公共链接的工厂而…

json php 数组读写_PHP如何将数据写入JSON?

I am newer for php. I want make php page cache, query data from mysql and store data into json format.I have many questions:which type of file should I store? .json or .txt or .cache? for I also need use json decode return datas into page.I want use cron…

加密后24位且最后两位是==

发现 某 xml 文件中的 标签 id 都是 24位大小写字母、数字加号、/等 共计 24位 且最后两位都是 测试发现用 16位数字经过base64可以得到类似的 格式 加密前:1234567890123456加密后:MTIzNDU2Nzg5MDEyMzQ1Ng 我这里的需求不是要解密,只是要模…

Java Syncrhonisers

线程通信主要通过共享对字段和对象的访问来发生。 尽管这种通信方式非常高效,但它易于出现诸如线程干扰和内存一致性之类的错误。 同步是一种有助于防止此类错误的工具。 但是,同步不是免费提供的,并且在访问当前由另一个线程持有的锁或对象…

MATLAB的VLFeat工具箱

下载地址:http://www.vlfeat.org/ 简介:VLFeat开源库实现了流行的计算机视觉算法,专门用于图像理解和局部特征提取和匹配。算法包括Fisher向量、VLAD、SIFT、MSER、k-means、分级k-means、agglomerative information bottleneck、SLIC超像素…

Phinecos(洞庭散人) 专注于开源技术的研究与应用 TinyXML:一个优秀的C++ XML解析器

读取和设置xml配置文件是最常用的操作,试用了几个C的XML解析器,个人感觉TinyXML是使用起来最舒服的,因为它的API接口和Java的十分类似,面向对象性很好。 TinyXML是一个开源的解析XML的解析库,能够用于C,能…

windows聚焦壁纸不更新_Win10无法自动更换聚焦锁屏壁纸怎么办?

Win10无法自动更换聚焦锁屏壁纸怎么办?在Win10系统的默认情况下,锁屏界面设置的是Windows聚焦,如果我们使用微软账户登录,系统会自动更换锁屏壁纸,让我们每天都能看到不一样的锁屏壁纸。然而有用户发现,系统…

jdbc-------JDBCUtil类 工具类

jdbcutil 主要处理的是 连接数据库, 和关闭各个流 1, 数据库连接的配置信息: mysql.properties (在工程的目录下)个人配置 urljdbc:mysql://localhost:3306/test drivercom.mysql.jdbc.Driver usernameroot password123 2, 获取连…