1 藤井美娜 Python的NLP实战分享 如何实现合同风险预测模型 benchmark。 • 使用同一个分词办法来处理各领域的语言数据做一个词类频次分 布表,在各词性出现频次涂上颜色。 这些数据的倾向 会都一样吗? ※BCCWJ语料库(現代日本語書き言葉均衡コーパス)请看:https://pj.ninjal.ac.jp/corpus_center/bccwj/ 使用corpus做EDA 37% |################################## 为什么做EDA? 知道⾃⼰⼿⾥的语⾔数据的倾向可以:后⾯的⼯作的处理会⾼效率 • 对选model有把握 • 对后⾯出来的结果的理解有⽤(可以猜结果的为什么) 合同 文章 出版 図書 出版 雑誌 出版 新聞 図書館 書籍 政府 报告 课文 宣传 文章 Yahoo! 知识库 Yahoo! 博客 韵文 畅销 書籍 法律 文章 出现单词 种类数 出现单词 总数 42% | 为什么做EDA? 知道⾃⼰⼿⾥的语⾔数据的倾向可以:后⾯的⼯作的处理会⾼效率 • 对选model有把握 • 对后⾯出来的结果的理解有⽤(可以猜结果的为什么) 合同 文章 出版 図書 出版 雑誌 出版 新聞 図書館 書籍 政府 报告 课文 宣传 文章 Yahoo! 知识库 Yahoo! 博客 韵文 畅销 書籍 法律 文章 Q. 为什么要做EDA? A. 为了把握自己的数据倾向。0 码力 | 36 页 | 3.95 MB | 1 年前3
JavaScript Promise迷你书(中文版)`done` for test?', function (done) { var promise = Promise.resolve(1); // このテストコードはある欠陥があります promise.then(function (value) { assert(value === 1);0 码力 | 112 页 | 1010.02 KB | 1 年前3
3 Python的NLP实战分享 如何实现合同风险预测模型 藤井美娜为什么做EDA? 知道自己手里的语言数据的倾向可以:后面的工作的处理会高效率 • 对选model有把握 • 对后面出来的结果的理解有用(可以猜结果的为什么) 合同 文章 出版 図書 出版 雑誌 出版 新聞 図書館 書籍 政府 报告 课文 宣传 文章 Yahoo! 知识库 Yahoo! 博客 韵文 畅销 書籍 法律 文章 42% |######################################## 为什么做EDA? 知道自己手里的语言数据的倾向可以:后面的工作的处理会高效率 • 对选model有把握 • 对后面出来的结果的理解有用(可以猜结果的为什么) 合同 文章 出版 図書 出版 雑誌 出版 新聞 図書館 書籍 政府 报告 课文 宣传 文章 Yahoo! 知识库 Yahoo! 博客 韵文 畅销 書籍 法律 文章 Q. 为什么要做EDA? A. 为了把握自己的数据倾向。 没/吃 手机 汉语 57% |##################################################### 食べ/た 食べ/て/ない 携帯電話 携帯 ケータイ電話 けいたい ケータイ ケータイ 日语 食べる 携帯電話 • 动词活用的统一工作 • 名词的统一工作 | section2 NLP基础@日中英 59% |##################0 码力 | 33 页 | 1.67 MB | 1 年前3
Apache RocketMQ 介绍解决KafKa数据存储与顺序一致性保证 ● Kafka : Ordering Guarantees ● Apache Kafka 从 0.7 到 1.0:那些年我们踩过的坑 ● Apache Kafkaの概要とアーキテクチャ ● Apache RocketMQ ● 专访RocketMQ联合创始人:项目思路、技术细节和未来规划 ● The Apache Software Foundation Announces0 码力 | 5 页 | 375.48 KB | 1 年前3
Golang 101(Go语言101 中文版) v1.21.aVERSION 4| Ĝo 5| Π 下面是一些合法的未导出标识符: 1| _ 2| _status 3| memStat 4| book 5| π 6| 一个类型 7| 변수 8| エラー 下面这些不能被用做标识符: 1| // Unicode数字开头 2| 123 3| 3apples 4| 5| // 含有不符合要求的Unicode字符 6| a.b 7| *ptr 8|0 码力 | 821 页 | 956.82 KB | 1 年前3
Golang 101(Go语言101 中文版) v1.21.a下面是一些合法的导出标识符: Player_9 DoSomething VERSION Ĝo Π 下面是一些合法的未导出标识符: _ _status memStat book π 一个类型 변수 エラー 下面这些不能被用做标识符: // Unicode数字开头 123 3apples // 含有不符合要求的Unicode字符 a.b *ptr $name a@b.c // 这两个是关键字0 码力 | 608 页 | 1.08 MB | 1 年前3
Golang 101(Go语言101 中文版) v1.21.a4| Ĝo 5| Π 下面是一些合法的未导出标识符: 1| _ 2| _status 3| memStat 4| book 5| π 6| 一个类型 7| 변수 8| エラー 下面这些不能被用做标识符: 1| // Unicode数字开头 2| 123 3| 3apples 4| 5| // 含有不符合要求的Unicode字符 6| a.b 7|0 码力 | 591 页 | 21.40 MB | 1 年前3
共 7 条
- 1













