文本生成技术是深度学习赋予自然语言处理一项全新的技术,而刚好网上有这方面诸多的例子,因此趁着有空实现一下中国古诗的自动生成技术,还是挺好玩的。
具体步骤主要包括以下几点:
(1) 准备语料库,即对据有的古诗进行获取。
(2) 生成关键词,并进行词向量转化。
(3) 利用RNN的编码解码模型进行训练,由于RNN具备一对多的输出,因此可以很好地解决这种自动生成技术。
本文的具体参考代码为:https://github.com/DevinZ1993/Chinese-Poetry-Generation
由于原始代码是在python2.7环境下,因此需要更改多处代码才能运行。主要细节在于一些变量,filter, sorted ,cmp等这种python3所替代的方法。
(3) 测试结果如下:
做诗的相关文字为: 我佛慈悲
关键词个数为:4
关键词:
翻
冥
慈悲
我佛
生成古诗:
岭田商步更但望,为望柴眼亩魂新。
顶情向年一羽又,好时寂中田全心。
做诗的相关文字为: 我佛慈悲
关键词个数为:4
关键词:
冥
我佛
慈悲
翻
生成古诗:
千饥更琐初边臣,一花雷嶂化个残。
遂姿灵阴白鉴酒,诗宦无看烟衲骖。
做诗的相关文字为: 我佛慈悲
关键词个数为:4
关键词:
冥
慈悲
我佛
翻
生成古诗:
梦郑西清超江明,重共齐时日骝归。
送河醉其堪山韵,也樽定胜自隔规。
做诗的相关文字为: 我佛慈悲
关键词个数为:4
关键词:
我佛
翻
慈悲
冥
生成古诗:
布胸照似细士庙,故晚攀陵诗下暇。
东池只千一叶处,我道今老一力霞。
做诗的相关文字为: 我佛慈悲
关键词个数为:4
关键词:
慈悲
我佛
翻
冥
生成古诗:
蝴边客云道饶偃,玉竹似病限分家。
秋说听飞眉早看,但回何满缥东佳。
做诗的相关文字为: 我佛慈悲
关键词个数为:4
关键词:
冥
翻
慈悲
我佛
生成古诗:
云瑟累瓶辱州莫,楚花拄处自鹅苔。
谏是君雨是不过,叠行宝舟突髯台。
做诗的相关文字为: 我佛慈悲
关键词个数为:4
关键词:
慈悲
冥
我佛
翻
生成古诗:
浓枝十老不密飘,笙中北大落整长。
好问即陈梅多却,高凡到汾倚逢肠。
做诗的相关文字为: 我佛慈悲
关键词个数为:4
关键词:
慈悲
我佛
冥
翻
生成古诗:
猛事枝人春皪头,只向华声慈衣弦。
须似心上换皆土,数人怜少间及仙。