Skip to content

Commit

Permalink
doc: 增加各文集README介绍, 优化README.
Browse files Browse the repository at this point in the history
  • Loading branch information
jackeyGao committed Dec 14, 2018
1 parent 834126b commit 032ed2a
Show file tree
Hide file tree
Showing 6 changed files with 240 additions and 63 deletions.
85 changes: 25 additions & 60 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -3,9 +3,10 @@ chinese-poetry

[![Build Status](https://travis-ci.org/chinese-poetry/chinese-poetry.svg?branch=master)](https://travis-ci.org/chinese-poetry/chinese-poetry)
[![License](http://img.shields.io/badge/license-mit-blue.svg?style=flat-square)](https://github.com/jackeyGao/chinese-poetry/blob/master/LICENSE)
[![tang poetry](https://img.shields.io/badge/tang%20poetry-5.5w-green.svg)]()
[![song poetry](https://img.shields.io/badge/song%20poetry-22w-green.svg)]()
[![song ci](https://img.shields.io/badge/song%20Ci-21k-green.svg)]()
[![](https://img.shields.io/github/contributors/chinese-poetry/chinese-poetry.svg)](https://github.com/chinese-poetry/chinese-poetry/graphs/contributors)

[shici.store](https://shici.store)


最全的中华古典文集数据库, 包含5.5万首唐诗、26万首宋诗和2.1万首宋词. 唐宋两朝近1.4万古诗人, 和两宋时期1.5K词人. 数据来源于互联网.

Expand All @@ -20,63 +21,31 @@ chinese-poetry

|唐诗高频词|唐诗作者作品榜|
| :---: | :---: |
| ![唐诗高频词](https://raw.githubusercontent.com/chinese-poetry/chinese-poetry/master/images/tang_text_topK.png "唐诗高频词")| ![唐诗作者作品榜](https://raw.githubusercontent.com/chinese-poetry/chinese-poetry/master/images/tang_author_topK.png "唐诗作者作品榜")|
| ![唐诗高频词](https://raw.githubusercontent.com/jackeygao/chinese-poetry/master/images/tang_text_topK.png "唐诗高频词")| ![唐诗作者作品榜](https://raw.githubusercontent.com/jackeygao/chinese-poetry/master/images/tang_author_topK.png "唐诗作者作品榜")|
|宋诗高频词|宋诗作者作品榜|
| ![宋诗高频词](https://raw.githubusercontent.com/chinese-poetry/chinese-poetry/master/images/song_text_topK.png "宋诗高频词" )| ![宋诗作者作品榜](https://raw.githubusercontent.com/chinese-poetry/chinese-poetry/master/images/song_author_topK.png "宋诗作者作品榜")|
| ![宋诗高频词](https://raw.githubusercontent.com/jackeygao/chinese-poetry/master/images/song_text_topK.png "宋诗高频词" )| ![宋诗作者作品榜](https://raw.githubusercontent.com/jackeygao/chinese-poetry/master/images/song_author_topK.png "宋诗作者作品榜")|
|宋词高频词|宋词作者作品榜|
| ![宋词高频词](https://raw.githubusercontent.com/chinese-poetry/chinese-poetry/master/images/ci_words_topK.png "宋词高频词") |![宋词作者作品榜](https://raw.githubusercontent.com/chinese-poetry/chinese-poetry/master/images/ci_author_topK.png "宋词作者作品榜") |
| ![宋词高频词](https://raw.githubusercontent.com/jackeygao/chinese-poetry/master/images/ci_words_topK.png "宋词高频词") |![宋词作者作品榜](https://raw.githubusercontent.com/jackeygao/chinese-poetry/master/images/ci_author_topK.png "宋词作者作品榜") |

|两宋喜欢的词牌名|
| :---: |
|![两宋喜欢的词牌名](https://raw.githubusercontent.com/chinese-poetry/chinese-poetry/master/images/ci_rhythmic_topK.png)|

## 数据分发形式

古诗数据分发采用繁体字的分组JSON文件, 保留繁体能更大程度地保存原数据. 宋词数据分发采用sqlite数据库, 使用简体字(无原因, 采集源就是简体, 如需繁体请自行转换).

### 其他类型结构数据

- [chinese-poetry](https://github.com/chinese-poetry) **/** [chinese-poetry-zhCN](https://github.com/chinese-poetry/chinese-poetry-zhCN) 简体中文版本数据
- [KomaBeyond](https://github.com/KomaBeyond) **/** [chinese-poetry-mysql](https://github.com/KomaBeyond/chinese-poetry-mysql) 适用于mysql数据库的格式数据

### 转换数据库格式工具

- [chinese-poetry-to-mysql-tool](https://github.com/woodylan/chinese-poetry-to-mysql-tool) 转换成sql文件的脚本

### 古诗JSON结构

```text
[
{
"strains": [
"平平平仄仄,平仄仄平平。",
"仄仄平平仄,平平仄仄平。",
"平平平仄仄,平仄仄平平。",
"平仄仄平仄,平平仄仄平。"
],
"author": "太宗皇帝",
"paragraphs": [
"秦川雄帝宅,函谷壯皇居。",
"綺殿千尋起,離宮百雉餘。",
"連甍遙接漢,飛觀迥凌虛。",
"雲日隱層闕,風煙出綺疎。"
],
"title": "帝京篇十首 一"
},
... 每单个JSON文件1000条唐诗记录.
]
```
### 作者JSON结构

```json
[
{
"name": "太宗皇帝",
"desc": "帝姓李氏,諱世民,神堯次子,聰明英武。貞觀之治,庶幾成康,功德兼隆。由漢以來,未之有也。而銳情經術,初建秦邸,即開文學館,召名儒十八人爲學士。既即位,殿左置弘文館,悉引內學士,番宿更休。聽朝之間,則與討論典籍,雜以文詠。或日昃夜艾,未嘗少怠。詩筆草隸,卓越前古。至於天文秀發,沈麗高朗,有唐三百年風雅之盛,帝實有以啓之焉。在位二十四年,諡曰文。集四十卷。館閣書目,詩一卷,六十九首。今編詩一卷。"
},
...
]
```
|![两宋喜欢的词牌名](https://raw.githubusercontent.com/jackeygao/chinese-poetry/master/images/ci_rhythmic_topK.png)|

## 数据集合

- 全唐诗 [json](https://github.com/chinese-poetry/chinese-poetry/tree/master/wudai)
- 全宋诗 [json](https://github.com/chinese-poetry/chinese-poetry/tree/master/json)
- 全宋词 [ci](https://github.com/chinese-poetry/chinese-poetry/tree/master/ci)
- 五代·花间集 [wudai](https://github.com/chinese-poetry/chinese-poetry/tree/master/wudai/%E8%8A%B1%E9%97%B4%E9%9B%86)
- 五代·南唐二主词 [wudai](https://github.com/chinese-poetry/chinese-poetry/tree/master/wudai/%E5%8D%97%E5%94%90%E4%BA%8C%E4%B8%BB%E8%AF%8D)
- 论语 [lunyu](https://github.com/chinese-poetry/chinese-poetry/tree/master/lunyu)
- 诗经 [shijing](https://github.com/chinese-poetry/chinese-poetry/tree/master/shijing)
- 幽梦影 [youmengying](https://github.com/chinese-poetry/chinese-poetry/tree/master/youmengying)

**待补充**

- 清代诗词
- 元曲

## 案例展示

Expand All @@ -88,10 +57,6 @@ chinese-poetry
- [okcy1016](https://github.com/okcy1016) **/** [poetry-desktop](https://github.com/okcy1016/poetry-desktop/) *诗词桌面*
- [huangjianke](https://github.com/huangjianke) **/** [weapp-poem](https://github.com/huangjianke/weapp-poem/) *诗词墨客 小程序版*

### 公众号

- **PoemSearcher**


## 贡献&讨论

Expand All @@ -104,4 +69,4 @@ chinese-poetry

## License

[MIT](https://github.com/chinese-poetry/chinese-poetry/blob/master/LICENSE) 许可证.
[MIT](https://github.com/chinese-poetry/chinese-poetry/blob/master/LICENSE) 许可证.
51 changes: 48 additions & 3 deletions ci/README.md
Original file line number Diff line number Diff line change
@@ -1,6 +1,53 @@
全宋词
---
-----

《全宋词》是中国近百年来最重要的古籍整理成果之一。宋词和唐诗均为中国古典诗的艺术高峰。清代所编《全唐诗》是家喻户晓籍,现又新编出《全宋词》,堪称中国文学的双璧。全书共五册,荟萃宋代三百年间的词作。 来自[百科](https://baike.baidu.com/item/%E5%85%A8%E5%AE%8B%E8%AF%8D)

## 说明

简体中文分发.


## 数据形式

*ci.song.[0-21000].json*

每个 JSON 文件1000条记录. 为了举例, 删除了余下999条.

```
[
{
"author": "石孝友",
"paragraphs": [
"扁舟破浪鸣双橹。",
"岁晚客心分万绪。",
"香红漠漠落梅村,愁碧萋萋芳草渡。",
"汉皋佩失诚相误。",
"楚峡云归无觅处。",
"一天明月缺还圆,千里伴人来又去。"
],
"rhythmic": "玉楼春"
}
]
```

*作者介绍 JSON*

*author.song.json*

```
[
{
"description": "苏轼:(1037-1101)北宋文学家、书画家。字子瞻,号东坡居士,眉州 眉山(今属四川)人。苏洵子。嘉佑进士。神宗时曾任祠部员外郎,因 反对王安石新法而求外职,任杭州通判,知密州、徐州、湖州。后以作 诗“谤讪朝廷”罪贬黄州。哲宗时任翰林学士,曾出知杭州、颖州等, 官至礼部尚书。后又贬谪惠州、儋州。北还后第二年病死常州 。南宋 时追谥文忠。与父洵弟辙,合称“三苏”。在政治上属于旧党,但也有改革弊政的要求。其文汪洋恣肆,明白畅达,为“唐宋八大家”之一 。其诗清新豪健,善用夸张比喻,在艺术表现方面独具风格。少数诗篇 也能反映民间疾苦,指责统治者的奢侈骄纵。词开豪放一派,对后代很 有影响。《念奴娇・赤壁怀古》、《水调歌头・丙辰中秋》传诵甚广。 擅长行书、楷书,取法李邕、徐浩、颜真卿、杨凝式,而能自创新意。 用笔丰腴跌宕,有天真烂漫之趣。与蔡襄、黄庭坚、米芾并称“宋四家 ”。能画竹,学文同,也喜作枯木怪石。论画主张“神似”,认为“论 画以形似,见与儿童邻”;高度评价“诗中有画,画中有诗”的艺术 造诣。诗文有《东坡七集》等。存世书迹有《答谢民师论文帖》、《 祭黄几道文》、《前赤壁赋》、《黄州寒食诗帖》等。画迹有《枯木怪石图》、《竹石图》等。--(1037―1101)字子瞻,号东坡居士。眉州眉山(今属四川)人。苏洵长子。嘉二年(1057)进士。累除中书舍人、翰林学士、 端明殿学士、礼部尚书。曾通判杭州,知密州、徐州、湖州、颍州等。元丰三年(1080)以谤新法贬谪黄州。绍圣初,又贬惠州、儋州。徽宗立,赦还。卒于常州。追谥文忠。博学多才,善文,工诗词,书画俱佳。于词“豪放,不喜剪裁以就声律”,题材丰富,意境开阔,突破晚唐五代和宋初以来“词为艳科”的传统樊篱,以诗为词,开创豪放清旷一派,对后世产生巨大影响。代表作有 《念奴娇・赤壁怀古》、《江神子・猎主要作品有:定风波(莫听穿林打叶声)昭君怨(谁作桓伊三弄)洞仙歌(冰肌玉骨)浣溪沙(游蕲水清泉寺)西江月(顷在黄州)八声甘州・寄参寥子浣溪沙(簌簌衣巾落枣花)水龙吟(似花还似非花)行香子・过七里滩永遇乐(彭城夜宿燕子楼)西江月・重九(点点楼头细雨)满江红(江汉西来)满江红・怀子由作(清颍东流)江城子(十年生死两茫茫)念奴娇・赤壁怀古②临江仙(夜饮东坡醒复醉)水调歌头(明月几时有)蝶恋花(花褪残红青杏小)鹧鸪天(林断山明竹隐墙)望江南(春未老)卜算子(缺月挂疏桐)贺新郎(乳燕飞华屋)阮郎归(绿槐高柳咽新蝉)",
"name": "苏轼",
"short_description": "(1037―1101)字子瞻,号东坡居士。眉州眉山(今属四川)人。苏洵长子。嘉二年(1057)进士。累除中书舍人、翰林学士、 端明殿学士、礼部尚书。曾通判杭州,知密州、徐州、湖州、颍州等。元丰三年(1080)以谤新法贬谪黄州。绍圣初,又贬惠州、儋州。徽宗立,赦还。卒于常州。追谥文忠。博学多才,善文,工诗词,书画俱佳。于词“豪放,不喜剪裁以就声律”,题材丰富,意境开阔,突破晚唐五代和宋初以来“词为艳科”的传统樊篱,以诗为词,开创豪放清旷一派,对后世产生巨大影响。代表作有 《念奴娇・赤壁怀古》、《江神子・猎"
}
]
```

ci.sql* Sqlite 版本

注意: 此版本不保证持续维护, 它不能和版本控制很好的配合.

```sql
sqlite> .tables
Expand All @@ -23,5 +70,3 @@ sqlite> select * from ciauthor limit 1;
1|苏轼|苏轼:(1037-1101)北宋文学家、书画家...
```



64 changes: 64 additions & 0 deletions json/README.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,64 @@
全唐诗 & 全宋诗
===============

> **注意:** 《全唐诗》和《全宋诗》都是诗题材的集合, 意味着在本目录找不到词。 宋词请移步到[/ci](https://github.com/chinese-poetry/chinese-poetry/tree/master/ci).

《全唐诗》是清康熙四十四年(1705年),彭定求、沈三曾、杨中讷、汪士鋐、汪绎、俞梅、徐树本、车鼎晋、潘从律、查嗣瑮10人奉敕编校,“得诗四万八千九百余首,凡二千二百余人”, 共计900卷,目录12卷。 来自[百科](https://baike.baidu.com/item/%E5%85%A8%E5%94%90%E8%AF%97)

《全宋诗》继唐诗的高度繁荣之后,宋诗在思想内容和艺术表现上有新的开拓和创造,出现了许多优秀作家作品,形成了许多流派,对元、明、清的诗歌发展产生了深远影响。来自[百科](https://baike.baidu.com/item/%E5%85%A8%E5%AE%8B%E8%AF%97)


## 说明

《全唐诗》和《全宋诗》是繁体存储, 如有需要请自己转换, 但转换后的字不符合上下文。

目前此诗集还有大量错误需要更改, 欢迎提交 PR 修改。 个人精力优先, 但仍有愚公移山精神.

## 数据形式

*poet.tang.[0-99000].json*

*poet.song.[0-57000].json*

每个 JSON 文件有1000条诗.

```text
[
{
"strains": [
"平平平仄仄,平仄仄平平。",
"仄仄平平仄,平平仄仄平。",
"平平平仄仄,平仄仄平平。",
"平仄仄平仄,平平仄仄平。"
],
"author": "太宗皇帝",
"paragraphs": [
"秦川雄帝宅,函谷壯皇居。",
"綺殿千尋起,離宮百雉餘。",
"連甍遙接漢,飛觀迥凌虛。",
"雲日隱層闕,風煙出綺疎。"
],
"title": "帝京篇十首 一"
}
]
```

注意: 为了举例方便, 省略了剩下999篇诗.

### 作者JSON结构

*authors.tang.json*

*authors.song.json*

```json
[
{
"name": "太宗皇帝",
"desc": "帝姓李氏,諱世民,神堯次子,聰明英武。貞觀之治,庶幾成康,功德兼隆。由漢以來,未之有也。而銳情經術,初建秦邸,即開文學館,召名儒十八人爲學士。既即位,殿左置弘文館,悉引內學士,番宿更休。聽朝之間,則與討論典籍,雜以文詠。或日昃夜艾,未嘗少怠。詩筆草隸,卓越前古。至於天文秀發,沈麗高朗,有唐三百年風雅之盛,帝實有以啓之焉。在位二十四年,諡曰文。集四十卷。館閣書目,詩一卷,六十九首。今編詩一卷。"
},
]
```

注意: 为了举例方便, 仅举例一个诗人作者信息.
42 changes: 42 additions & 0 deletions lunyu/README.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,42 @@
论语
====

中国儒家经典,《论语》是孔子及其弟子的语录结集,由孔子弟子及再传弟子编写而成,至战国前期成书。全书共20篇492章,以语录体为主,叙事体为辅,主要记录孔子及其弟子的言行,较为集中地体现了孔子的政治主张、伦理思想、道德观念及教育原则等。此书是儒家学派的经典著作之一,与《大学》《中庸》《孟子》并称“四书”,再加上《诗经》《尚书》《礼记》《周易》《春秋》,总称“四书五经”。 来自百科


## 说明

繁体中文分发

感谢 [@wptoux](https://github.com/wptoux) 提供首版数据.

## 数据格式

*lunyu.json*


```
[
{
"chapter": "學而第壹",
"paragraphs": [
"子曰:“學而時習之,不亦悅乎?有朋自遠方來,不亦樂乎?人不知而不慍,不亦君子乎?”",
"有子曰:“其為人也孝悌而好犯上者,鮮矣。不好犯上而好作亂者,未之有也。君子務本,本立而道生。孝悌也者,其為仁之本與?”",
"子曰:“巧言令色,鮮矣仁。”",
"曾子曰:吾日三省乎吾身。為人謀而不忠乎?與朋友交而不信乎?傳不習乎?",
"子曰:道千乘之國,敬事而信,節用而愛人,使民以時。",
"子曰:弟子入則孝,出則悌,謹而信,泛愛眾而親仁,行有余力,則以學文。",
"子夏曰:賢賢易色,事父母,能竭其力。事君,能致其身。與朋友交,言而有信。雖曰未學,吾必謂之學矣。",
"子曰:君子不重則不威,學則不固。主忠信,無友不如己者,過則勿憚改。",
"曾子曰:慎終追遠,民德歸厚矣。",
"子禽問於子貢曰:“夫子至於是邦也,必聞其政。求之與?抑與之與?”子貢曰:“夫子溫良恭儉讓以得之。夫子求之也,其諸異乎人之求之與?”",
"子曰:父在,觀其誌。父沒,觀其行。三年無改於父之道,可謂孝矣。",
"有子曰:禮之用,和為貴。先王之道斯為美。小大由之,有所不行。知和而和,不以禮節之,亦不可行也。",
"有子曰:信近於義,言可復也。恭近於禮,遠恥辱也。因不失其親,亦可宗也。",
"子曰:君子食無求飽,居無求安。敏於事而慎於言,就有道而正焉。可謂好學也已。",
"子貢曰:“貧而無諂,富而無驕。何如?”子曰:“可也。未若貧而樂,富而好禮者也。”子貢曰:“詩雲:如切如磋,如琢如磨。其斯之謂與?”子曰:“賜也,始可與言詩已矣。告諸往而知來者。”",
"子曰:不患人之不己知,患不知人也。"
]
}
]
```
33 changes: 33 additions & 0 deletions shijing/README.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,33 @@
诗经
====

中国最早诗歌总集, 《诗经》,是中国古代诗歌开端,最早的一部诗歌总集,收集了西周初年至春秋中叶(前11世纪至前6世纪)的诗歌,共311篇,其中6篇为笙诗,即只有标题,没有内容,称为笙诗六篇(南陔、白华、华黍、由康、崇伍、由仪),反映了周初至周晚期约五百年间的社会面貌。 来自百科

## 说明


简体中文内容

感谢 [@snowtraces](https://github.com/snowtraces) 提供首版数据.

## 数据格式

*shijing.json*


```
[
{
"title": "关雎",
"chapter": "国风",
"section": "周南",
"content": [
"关关雎鸠,在河之洲。窈窕淑女,君子好逑。",
"参差荇菜,左右流之。窈窕淑女,寤寐求之。",
"求之不得,寤寐思服。悠哉悠哉,辗转反侧。",
"参差荇菜,左右采之。窈窕淑女,琴瑟友之。",
"参差荇菜,左右芼之。窈窕淑女,钟鼓乐之。"
]
}
]
```
28 changes: 28 additions & 0 deletions youmengying/README.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,28 @@
幽梦影
======

清代张潮创作文集

## 说明


简体中文内容

感谢 [@snowtraces](https://github.com/snowtraces) 提供首版数据.

## 数据格式

*youmengying.json*


```
[
{
"content": "读经宜冬,其神专也;读史宜夏,其时久也;读诸子宜秋,其致别也;读诸集宜春,其机物也。",
"comment": [
"曹秋岳曰:可想见其南面百城时。",
"庞笔奴曰:读《幽梦影》则春、夏、秋、冬,无时不宜。"
]
}
]
```

0 comments on commit 032ed2a

Please sign in to comment.