收录甲骨数量最多 清华大学发布《甲骨文摹本大系》******
光明日报北京12月19日电(记者邓晖)十年磨一剑,一部甲骨文资料整理的集大成之作面世。清华大学出土文献研究与保护中心日前发布了《甲骨文摹本大系》(以下简称《大系》)新书。该书收录有字甲骨70659片,是目前收录甲骨数量最多的大型甲骨著录书,将为研究者更深入地做好卜辞分类与分期研究、文字考释工作与甲骨学商史研究带来极大便利。
《大系》是第一部以摹本形式按照新的理论和方法综合整理研究甲骨文资料的集大成之作,把原本“庞杂无序”的已刊布的7万多片有字甲骨整理成井井有条的科学资料。全书共43册,由“图版”“释文”和“索引”三部分组成,正八开刊印。据悉,2012年至2022年,清华大学出土文献研究与保护中心黄天树教授率领其甲骨团队编纂《大系》,通过选择良拓、剔除伪片、删除重片、缀合残片、分类断代、制作摹本、撰写释文、编制索引等工作,历时十年,终于告竣。
与《甲骨文合集》等著录书相比,《大系》全书采用“两系”新说代替“五期”旧说,编排7万多片甲骨材料,开创了甲骨著录书编纂的新范式。
“董作宾创立五期说,凿破鸿蒙,意义深远。但是,其弊病是把甲骨字体分类和王世的推定混在一起了。今天,甲骨学者认识到,卜辞的字体分类与断代是两个不同的步骤,我们应先根据字体等特征分卜辞为若干类,然后分别判定各类所属时代。这是甲骨断代理论和研究方法上的重大突破。”黄天树介绍。
《大系》还精心为每版甲骨制作了摹本。甲骨作为珍贵的文物,学者很难接触到实物,因而研究甲骨文,主要依据甲骨著录书公布的拓本、照片和摹本。这三种图版各有优劣,可以取长补短。高质量的甲骨摹本,可以立体显示各种甲骨信息,为甲骨初学者提供参考。
此外,《大系》还给每一版有字甲骨标注了字体类别。黄天树介绍,殷墟甲骨文是最早的古汉语资料。但是,甲骨文要作为语料来运用的先决条件,便是要确定其时代。否则,10多万片甲骨依然是一堆“断烂朝报”,缺少科学价值。“字体类别的确定,意味着这版甲骨的时代已经得到推定,大大增加了作为史料的研究价值。”
20多年来,甲骨缀合成果层出不穷,新拼缀出来的甲骨缀合多达3000多组。其中有些甲骨缀合极为重要,复原出前所未见的新材料,极大地丰富了学界对殷商社会的认识。然而,团队成员发现,这些甲骨缀合成果分散在各种甲骨缀合专书、刊物和学术网站上,应用起来不太方便。
“《大系》收录2020年12月之前的所有缀合成果,省去学者翻检之苦。我们还撰写释文,编制索引。读者如果要查看相应甲骨拓本,通过《大系》索引可以检索到,十分便捷。”黄天树介绍。
《光明日报》( 2022年12月20日 11版)
提速近10倍!基于深度学习的全基因组选择新方法来了******
近日,中国农业科学院作物科学研究所、三亚南繁研究院大数据智能设计育种创新团队联合多家单位提出利用植物海量多组学数据进行全基因组预测的深度学习方法, 可以实现育种大数据的高效整合与利用,将助力深度学习在全基因组选择中的应用,为智能设计育种及平台构建提供有效工具。相关研究成果发表在《分子植物(Molecular Plant)》上。
全基因组选择作为新一代育种技术,通过构建预测模型,根据基因组估计育种值进行早期个体的预测和选择,从而缩短育种世代间隔,加快育种进程,节约成本,推动现代育种向精准化和高效化方向发展。
统计模型作为全基因组选择的核心,极大地影响了全基因组预测的准确度和效率。传统预测方法基于线性回归模型,难以捕捉基因型和表型间的复杂关系。
相较于传统模型,非线性模型(如深度网络神经)具备分析复杂非加性效应的能力,人工智能和深度学习算法为解决大数据分析和高性能并行运算等难题提供了新的契机,深度学习算法的优化将会提高全基因组选择的预测能力。
该研究团队以玉米、小麦和番茄3种作物的4种不同维度的群体数据为测试材料,通过创新深度学习算法框架开发了全基因组选择新方法。
与其他五种主流预测方法相比,该方法有以下优点: 可以利用多组学数据开展全基因组预测;算法设计中包含批归一化层、回调函数和校正线性激活函数等结构,可以有效降低模型错误率,提高运行速度;预测精度稳健,在小型数据集上的表现与目前主流预测模型相当,在大规模数据集上预测优势更加明显;计算时间与传统方法相近,比已有深度学习方法提速近10倍;超参数调整对用户更加友好。
该研究得到了国家重点研发计划、国家自然科学基金、海南崖州湾种子实验室和中国农业科学院科技创新工程等项目的支持。
学术支持
中国农业科学院作物科学研究所
记者
宋雅娟