埃数工程”的项目,以跟踪“埃数”。
当然了,“埃数工程”现在还没正式开始建立起来。
田立心在查找文献并再次接触到埃数时,便想起了这工程,并觉得自己有必要写一篇专门研究埃数的论文,以推动整个工程的建立。
为先辈树碑立传,大唱赞歌,自然也是有机会留名青史的,而且,弄这工程又不用自己花一毛钱。
何乐而不为?
在接触到埃数之后,田立心也由此想起了埃尔德什猜想,而他正好看过陶泽轩证明这个猜想的论文。
那么,理所当然的,他最近要写的论文也就从一篇变成了三篇,其题目分别为
《试用计算机算法分析唐朝诗人的关系》
《试用计算机算法分析“埃数”》
《保罗?埃尔德什的差异问题猜想的证明》
这三篇论文中,证明埃尔德什猜想的论文显然是最好写的一篇,——抄就完事了。
最难写的,当然要算是第二篇了。
但第二篇是第一篇的延续,只要将前面的论文写出来,用同样的方法就可以复制出第二篇来了,当然,过程或许有些繁琐,他要完成论文的时间或许需要一周或是半个月,或许需要更多的时间。
而田立心要写的第一篇论文,除了编程代码之外,思路啊、工具啊、假设啊之类的,一切都不是问题。
但田立心写这篇论文,而不是抄论文,多少还是会遇到一些难题的。
一,分析《唐诗》的工程实在太大了,这部书里边出现的诗有四万多首呢。
二,唐代诗人的别称太多了,比如说光是杜甫的称呼,就有子美、杜二、杜工部等等。
不过,既然这是一篇计算机论文,数量的多少倒是无关紧要。
毕竟,可以直接交给计算机来运算嘛,只要能将《唐诗》成功导入计算机就好了。
有关诗人的别称,需要费一番力气。
田立心使用的,是哈佛大学编纂的《中国历代人物传记资料库》(changrahical dataject,以下简称cbdb),cbdb记录了中国历代名人的传记资料,并保存在关系型数据库中。
cbdb由很多张表格组成,每张表中都记录了人物的不同信息。
田立心写这篇论文用到的主要列表有两张,——也就是人物的主要信息表(ga)和人物的别名表(altnadata)
na中查询出人物编号cernid,接着用cernid从altnadata中查询出别名,比如输入杜甫之后,表中就会出现子美、杜二、杜工部等一系列信息。
要是输入的是王维呢?
你会郁闷地发现,列表中会出现十几个同名同姓的王维。
这些王维中,只有一个才是他真正要找的人。
为了筛选目标人物的唐代诗人王维,就必须要添加王维所在的生卒年时间了。
经过这个操作,出现在列表中的人物果然是目标人物,他的别名也随之出现,正是让人印象深刻的王右丞、王摩诘。
而这,就是查找诗人的繁琐之处。
。