据字节跳动宣布,由字节跳动和北京大学联合开发的古籍数字化平台读古籍测试版上线目前平台已推出390部经典古籍,共计3000多万字,免费向公众开放未来三年,知古籍将逐步完成1万种古籍的智能整理,基本覆盖儒释道核心书目
据不完全统计,我国约有20万种古籍,其中8万种完成了数字图像扫描,而数字化的只有3—4万种。
为了方便人们在图书馆中搜索和阅读古籍,阅读古籍平台主要采用了三种人工智能技术:
1.字符识别,即利用OCR技术将古籍影印图像识别为字符目前行业内OCR的识别准确率平均为93%到94%,读古籍将这一数字提高到96%到97%
二,自动标点,指的是算法,对古籍上原来缺少的标点符号自动进行处理比如《论语》以学而学不如说开头,自动标点的结果是学而学不如说
第三,命名实体识别,即古籍中专有名词的识别,包括名称,地点,书籍,时间,官职等。
本站了解到,未来读古籍将实现自动整理校对,并免费开放这一能力,推动库存古籍的数字化平台还将向全社会开放古籍阅读检索的研究能力,鼓励有文献的学者上传自己的文献用户也可以参与再创造和再诠释
。声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
最新文章
- 8月份我国汽车产销继续保持快速增长态势
- 航空工业自研,第二架AG600M“鲲龙”今
- 与通威签订千亿硅料采购长单!1800亿全球
- 比亚迪半导体发布全局快门CMOS图像传感器
- 控股股东去年盈利超15亿元?交建股份拟6.
- 乘联会:9月新能源乘用车零售销量达61.1
- 晶盛机电2022年第三季度业绩预告:归母净
- 全球债市动荡不安美国公司债券ETF跌至新低
- 郭明錤:苹果MacBook生产未来将新增泰
- 小呗出行被诉无法还车、乱扣费,黄辉今年获简
- 最高奖励1000万!深圳将加快基于RISC
- 索尼Xperia5IV微单手机国行开启预售
- 本田和LG宣布斥资44亿美元在美国俄亥俄州
- 苹果macOS13开发者预览版Beta11
- YouTube博主成功将《毁灭战士》游戏移
- 蔚来宣布换电站总数突破1100座,用户日均
- 意大利工会要求Stellantis与法拉利
- 亚马逊收购一家仓库机器人公司后者成立于18
- 李易峰多次嫖娼被行政拘留商业版图盘点
- 消息称英伟达RTX30608GB和3060
- 长三角推动市场准入一体化一地受理异地审批
- 浙商证券给予金雷股份买入评级盈利能力持续改
- 现代氢燃料电池电动汽车今年前8月已销售74
- 西南证券一度封板,证券ETF基金51290
- 李易峰作品被下架母校撤下其海报一夜脱粉30
- 微软Win11ARM笔记本SurfaceP
- 飞凡料理,只为“董”你