首页 >>  正文

时字几种写法

来源:baiyundou.net   日期:2024-09-20

古彝文传承至今已有数千年历史,是世界上最古老的文字之一。合合信息与上海大学社会学院今天签署校企合作协议,双方将合力完成以国家珍贵古籍《西南彝志》为中心的贵州古彝文图像识别及数字化校对项目(简称“古彝文数字化项目”)。

此前,在中国西南多家高校的共同努力下,规范和通用彝文的数字化工作取得了重要突破,而上海大学携手合合信息推进的古彝文数字化项目,更侧重于对原生态彝文识别的攻坚克难。项目将根据上海大学古彝文研究员设计的四字节编码系统,引入合合信息智能文字识别技术,对异体字、变体字、误用字和混用字等进行标注、识别、比对,并由此建立起精确的彝文古籍电子数据库,在古彝文研究领域属于首创。

亟待识别的古彝文,比《康熙字典》字数还多

彝文是云南、贵州、四川等地的彝族人使用的文字,而“古彝文”专指在民间流通使用的原生态彝文。根据《滇川黔桂彝文字集》,目前记录在册的古彝文多达87046个。非母语研究者在翻译古彝文时,通常需要在母语者的帮助下记音,再用汉语逐字直译,最后采用汉语对整句话进行意译。

由于古彝文尚未取得预留的Unicode编码区段,数字化工程还处于起步阶段,所以在印刷出版时,需由一位彝文缮写员先将彝文字和国际编码抄写在书页的左侧,再将已输入电脑的汉文译文打印、剪切后粘贴在相应彝文字的右侧,形成目前常见的“四行体”彝汉文对译,过程十分繁琐。

古彝文与汉字并非一一对应关系,存在大量的异体字、变体字。在相对规范的汉译本彝文典籍中就有至少15%的变体字,原稿中只会更多;每个字的异体写法少则2-3个,多则几十种。从总量上看,未经整理规范的古彝文字符数高达八万七千多个,比《康熙字典》的四万七千余字还多。据古彝文数字化团队研究人员透露,若想要找到某个字在一本古籍里的全部样例,手动查阅需要耗费一整天,如建立起完善的古彝文数据库和翻译系统,可极大提升研究效率。

“汉文古籍识别所面对的页面残损、字形复杂、字迹模糊等问题,在彝文古籍识别中全部存在,还有一些任务是更加特殊的。”合合信息智能技术平台事业部副总经理郭丰俊博士提到,彝文古籍时常出现加字、替字、整句倒置、文字方向不统一等现象,给文字定位造成挑战。再加上古彝文从未经过统一,异体字、变体字众多。合合信息将基于“AI+OCR”融合下的智能文字识别技术,解决古彝文识别的版式检测、图像处理和文字识别的难题。

在此前举行的2021年、2022年世界人工智能大会上,合合信息用AI技术对甲骨文、西周钟鼎文进行精准识别。郭丰俊表示,甲骨文和古彝文追溯源头都属于以刻画符号表意的文字,两种文字的识别方式有相通之处,此次古彝文数字化项目的开启,也成为合合信息智能文字识别技术赋能文字保护及文化传承的重要里程碑。

用科技开启古彝文“传统的新生命周期”

1950年,当代著名社会学家费孝通先生访问贵州毕节时,率先认识到彝文古籍对理解西南边疆历史的重要性,并鼓励筹建翻译机构,也为当下的古彝文研究提供了支持。古彝文数字化项目发起人、上海大学人类学民俗学研究所讲师邵文苑所在的上海大学社会学院,便长期设有费孝通田野调查项目资助计划。

古籍数字化的过程同时也是保护古籍的过程。2017年,72位全国人大代表联名建议实施中华古籍数字资源总库体系建设工程,实现历史文明的有序传承。本次合合信息与上海大学共同研究的《西南彝志》共计26卷,有“彝族历史文化的百科全书”之誉,对研究彝族历史、经济、文化十分重要。

古彝文数字化的价值并不止步于学术研究。随着我国小康社会的全面建成,人们对精神文化关注度日益提升,以民俗为主题的现代文艺创作、娱乐活动让传统文化焕发新的生机,例如中央歌剧院演绎的柯尔克孜族英雄史诗《玛纳斯》,既尊重了民族文化特色,又体现了新时代的风采。

邵文苑提到,古彝文文献和口传史诗中记录了很多南诏古国、夜郎古国、巴蜀古国的奇闻异事,在理解典籍的基础上,可以通过电影、音乐剧、浸入式戏剧等形式进行创作,或打造“元宇宙”世界、IP主题乐园,让更多人跨越语种的隔阂,感受更多元的民族文化,倾听独具特色的中国故事。

“传统也和人一样有生老病死的过程,并和人一样有通过后代延续‘生命’的能力,这种理论被称为‘传统的生命周期’。”邵文苑表示,智能文字识别技术“牵手”传统典籍研究,会是古彝文“传统的新生命周期”的开始。

\n
\n
\n
\n
\n

  作者:徐晶卉

\n

  编辑:张天弛

\n

责任编辑:戎兵

\n
\n
\n
\n
\n

*文汇独家稿件,转载请注明出处。

","force_purephv":"0","gnid":"943d21929444aa077","img_data":[{"flag":2,"img":[{"desc":"","height":"628","title":"","url":"https://p0.ssl.img.360kuai.com/t0172fc16f6e45e1eae.jpg","width":"864"},{"desc":"","height":"508","title":"","url":"https://p0.ssl.img.360kuai.com/t0191204049d790f57c.jpg","width":"865"},{"desc":"","height":"383","title":"","url":"https://p0.ssl.img.360kuai.com/t01f43f470adbd73c20.jpg","width":"754"}]}],"original":0,"pat":"art_src_1,fts0,sts0","powerby":"hbase","pub_time":1671614418000,"pure":"","rawurl":"http://zm.news.so.com/72a54408bd2d6d381c5a83c310f70eff","redirect":0,"rptid":"45c846a71c2c4830","s":"t","src":"文汇网","tag":[{"clk":"ktechnology_1:康熙字典","k":"康熙字典","u":""},{"clk":"ktechnology_1:上海大学","k":"上海大学","u":""}],"title":"总量比《康熙字典》还多,一个字有几十种写法......合合信息用AI挑战古彝文识别

都旭溥4351花字都有几种写法 -
齐朗储17376349942 ______ 中国字的写法,千变万化,如“百福图”中的福,有一百种写法,粗细变化,不可穷尽,所以中国字可以说有千万种写法. 花字,在古时候和华字一样意思,所以原来也就和华姓同出一源,后来到了唐朝时,字意稍微有了些区别,花更多地当名...

都旭溥4351百家姓起源于哪个朝代? -
齐朗储17376349942 ______ 在中华民族的文明史上,姓名一直是个人作为社会成员的一个最重要的识别符号.其中"名"一般由父辈取立,"姓"则系世代相传,源远流长.那么,自己的姓氏到底源于何处?它在历史长河中发生了哪些演变?又有哪些历史名人?我国的姓...

都旭溥43515有几种写法
齐朗储17376349942 ______ 数字5有3种写法:中文数字、罗马数字、阿拉伯数字.中文数字:一、二、三、四、五、六、七、八、九、零.罗马人用字母表示数,Ⅰ表示1,Ⅴ表示5,Ⅹ表示10,C表示100,而M表示1000.这样,大数字写起来就比较简短,但计算仍然十分不便.阿拉伯数字是最普遍的一种.阿拉伯数字并不是阿拉伯人发明的而是印度人发明的,实际应该列为印度语言,只是先传播到阿拉伯,然后传向世界的,所以称之为“阿拉伯数字”.

都旭溥4351古代“信”字有几种写法 -
齐朗储17376349942 ______ 简:在没有发明造纸术之前,我国曾用削成狭长的竹片作为书写材料,人们把这种竹片称为简.用于写信的竹片便称为竹简. 牍:古代书写用的薄而小的木片称为牍,汉代对简和牍串起来写字时,诏书律令宽不超过三尺,一般书信宽不过一尺...

都旭溥4351贰有几种写法?
齐朗储17376349942 ______ 八种贰的中文写法发现有八种之多.将贰拆解部首为“二”、“戈”、“贝”,那么发现的曾经的写法有:貮,一戈贝,弍贝(上下结构),弍,二戈贝,二戈贝,贰,贰...

都旭溥4351贰有几种写法
齐朗储17376349942 ______ 有3种 ,贰的三种写法:一是二字在弋的上面或是下面.贝字是简体还是繁体或是省略.丶是在弋的右上方或是右下方.当然,也有人说那个两横在戈字上面二是错误的,因为在中国众多字典里都没有关于这个二字的批注或说明.在第一套人民币中,7种20元票券和5种200元票券正背面共出现了18处贰字,其中二字写在弋上的有8处,写在弋下的有10处.将贝字省略是一些人经常使用的错误写法,人民币上没有出现.第一套至第三套人民币和2分硬币上的27处贝字都是采用繁体字,第四套、第五套人民币和1980版2角硬币上的4处贝字则采用了简体字.

都旭溥4351“罗”字的几种写法 -
齐朗储17376349942 ______ 有;梦,寐(读MENG读音时,有是通魅),魇,生花,还有几种写法打不出来是这样的 草字头加,"罗"的中间加个"秃宝盖" 古文中,通假字同"懵" 上面两个人一样的下面一个罗 还有种最少见的,罗外面加个大口框

都旭溥4351写钢笔字要注意什么 -
齐朗储17376349942 ______ 中国书法,博大精深,源远流长,位置“四大国粹”之首,是世界文化艺术宝库中的一枝奇葩.在世界各国文字的书写中,唯一被公认为书法艺术品的只有汉字,可谓一字千金,这是我们民族的骄傲.作为中学生,应该写好中国字.古人写毛笔...

都旭溥4351寒字的草书有几种写法 -
齐朗储17376349942 ______ 寒字的草书有2种写法. 寒字草书狂草的写法如下图: 寒字草书小草的写法如下图: 拼音:hán 部首:宀 笔画:12 五笔:PFJU 仓颉:JTCY 郑码:WDOT 笔顺编号:445112213444 四角号码:30303 释义: 1.冷(跟“暑”相对):~冬.~...

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024