浏览全部资源
扫码关注微信
上海中医药大学(上海 201203)
刘丽莉,女,硕士研究生,主要从事中医药标准化研究工作
李明,副研究员,硕士研究生导师; E-mail:lm@shutcm.edu.cn
纸质出版日期:2024-07-10,
收稿日期:2023-11-04,
扫 描 看 全 文
刘丽莉,李明,罗晓兰,等.基于自然语言处理智能技术的中医术语研究文献计量分析[J].上海中医药杂志,2024,58(7):1-6.
LIU Lili,LI Ming,LUO Xiaolan,et al.Bibliometric analysis of traditional Chinese medicine terminology research based on natural language processing technologies[J].Shanghai Journal of Traditional Chinese Medicine,2024,58(7):1-6.
刘丽莉,李明,罗晓兰,等.基于自然语言处理智能技术的中医术语研究文献计量分析[J].上海中医药杂志,2024,58(7):1-6. DOI: 10.16305/j.1007-1334.2024.2311017.
LIU Lili,LI Ming,LUO Xiaolan,et al.Bibliometric analysis of traditional Chinese medicine terminology research based on natural language processing technologies[J].Shanghai Journal of Traditional Chinese Medicine,2024,58(7):1-6. DOI: 10.16305/j.1007-1334.2024.2311017.
目的
2
对国内外近20年来发表的涉及自然语言处理(NLP)智能技术应用于中医术语识别或标注方面的文献进行计量分析与评价,探讨NLP智能技术在中医术语标准研究中的应用和发展前景。
方法
2
检索收集2003年1月至2023年10月期间,中国知网、维普中文科技期刊数据库、万方数据知识服务平台、中国生物医学文献服务系统及Web of Science等中英文数据库中的相关文献。采用Excel vba、Gephi、PyCharm等数据处理和统计分析工具,应用频数统计、Apriori关联分析、词云统计等文献计量学方法,对相关研究热点进行可视化分析。
结果
2
①经筛选,符合研究标准的文献共442篇,其中中文文献320篇、英文文献122篇。②2016年以后,相关发文量呈现持续增长的趋势。③发文国家主要集中在中国。④中文文献中硕博士学位论文比重较大,其中发文量最高的是北京交通大学。⑤中文文献发文机构以中国中医科学院发文量最高;英文文献发文机构以北京科技大学发文量最高;中医机构与计算机相关机构合作频繁。⑥基于BERT的命名实体识别算法在中医术语研究中的应用效果最为显著。⑦中医文献类的数据占比较大。
结论
2
基于NLP智能技术的中医术语标准化研究仍处于探索阶段,现有研究表现出技术应用的多样性,但缺乏系统性。鉴于NLP智能技术在中医术语识别和标注方面的潜力,未来研究需进一步加强,以期实现中医术语标准研究的系统化、智能化与广泛应用。
Objective
2
To conduct a bibliometric analysis and evaluation of domestic and international literature published in the last 20 years on the application of natural language processing (NLP) technologies in the identification and labelling of traditional Chinese medicine (TCM) terminology, and explore the application and future development prospects of NLP technologies in the standardization research of TCM terminology.
Methods
2
Literature from January 2003 to October 2023 was retrieved from databases including China National Knowledge Infrastructure (CNKI), VIP Chinese Science and Technology Journal Database (VIP), Wanfang Data Knowledge Service Platform (Wanfang), China Biomedical Literature Service System (SinoMed), and Web of Science. Data processing and statistical analysis tools such as Excel vba, Gephi, and PyCharm were used, employing bibliometric methods like frequency statistics, Apriori association analysis, and word cloud statistics to visually analyze the research hotspots.
Results
2
①After screening, 442 papers met the research criteria, comprising 320 in Chinese and 122 in English. ②Publications showed a consistent growth trend from 2016 to 2023. ③The majority of publications were from China. ④Among the collected Chinese literature, a significant proportion of publications were master's and doctoral theses, with the highest number of publications from Beijing Jiaotong University. ⑤The China Academy of Chinese Medical Sciences had the highest publication count in Chinese, while University of Science and Technology Beijing led in English publications. There was frequent collaboration between TCM institutions and computer science institutions. ⑥The application of named entity recognition (NER) with BERT showed the most significant effects in TCM terminology research. ⑦Data related to TCM literature accounted for a substantial proportion.
Conclusions
2
NLP-based research on the standardization of TCM terminology is still in the exploratory stage. Previous studies have shown the diversity of technology applications but lack systematization. Considering the potential of NLP technologies in TCM terminology recognition and labelling, further research is required to achieve systematic and intelligent TCM terminology standardization research and its widespread application.
人工智能自然语言处理智能识别中医术语中医标准化文献计量学
artificial intelligencenatural language processingintelligent recognitiontraditional Chinese medicine terminologytraditional Chinese medicine standardizationbibliometrics
伯德,克莱因,洛珀. Python自然语言处理[M]. 陈涛,张旭,崔杨,译. 北京:人民邮电出版社,2014: 1-3.
李明,周强,娄月丽,等.《中医病证分类与代码:GB/T 15657—2021》实施效果初步评价[J].上海中医药杂志,2022, 56(11): 1-6.
李明,周强,罗晓兰,等.中医症状术语标准及其分类体系研究[J].中华中医药杂志,2021, 36(8): 4838-4842.
胡为,刘伟,石玉敬.基于BERT-BiLSTM-CRF的中医医案命名实体识别方法[J].计算机时代,2022(9): 119-122, 135.
刘一斌,叶辉,易珺,等.基于朴素贝叶斯和word2vec的中医电子病历文本信息抽取[J].世界科学技术-中医药现代化,2020, 22(10): 3563-3568.
原旎,卢克治,袁玉虎,等.基于深度表示的中医病历症状表型命名实体抽取研究[J].世界科学技术-中医药现代化,2018, 20(3): 355-362.
刘凯,周雪忠,于剑,等.基于条件随机场的中医临床病历命名实体抽取[J].计算机工程,2014, 40(9): 312-316.
张煜斌,陆建峰,李文林,等.基于Meta-Bootstrapping的中医医案结构化研究[J]. 微电子学与计算机,2009, 26(10): 111-114.
王冰. 中医医案文本消歧算法的研究与实现[D]. 济南:山东师范大学,2020.
屈丹丹,杨涛,朱垚,等. 基于字向量的BiGRU-CRF肺癌医案四诊信息实体抽取研究[J].世界科学技术-中医药现代化,2021, 23(9): 3118-3125.
胡定兴,杜建强,石强,等.面向中医电子病历的症状实体及属性抽取[J]. 现代信息科技,2022, 6(3): 70-75.
肖晓霞,刘明婷,杨冯天赐,等. 基于NLP的中医医案文本快速结构化方法[J].大数据,2022, 8(3): 128-139.
赵方曼. 基于机器阅读理解的交互式中医问答系统研究[D]. 沈阳:沈阳工业大学,2021.
朱玲,李敬华,胡钦谙,等. 基于词向量计算的中医症状术语相似度研究[J]. 中国数字医学,2019, 14(10): 28-31.
刘彬,肖晓霞,邹北骥,等.融合汉字部首的BERT-BiLSTM-CRF中医医案命名实体识别模型[J].医学信息学杂志,2023, 44(6): 48-53.
0
浏览量
0
下载量
0
CSCD
0
CNKI被引量
关联资源
相关文章
相关作者
相关机构