自然言語処理

PyTorchチュートリアル 〜翻訳モデルを作る Attention付きSeq2Seq〜

人間の思考を彩るのは言語である。言語自体の表現力が乏しいと思考は制限されてしまう。 つまり、多様な言語から情報を取り言えれることで、思考が豊かになります。でも、一つの言語を学ぶのは多大なリソースを要します。じゃあ、機械に翻訳してもらおうとい…

Pytorchチュートリアルのテキスト分類 ~ torchtextとEmbeddingBag ~

世界に舞う無数のとめどない言葉。これらは生まれては、区別の無い大きな箱に積み重なって忘れられていく。まるで情報過多なのに何も残っていない人間の記憶のように。しかし、ひとたび境界線ができると、情報は区別され、整理される。そして、ヒトの理解は…

Pythonを使って文章から共起ネットワークを作る

今回は文章から共起ネットワークを作ってみたいと思います。一つの文内で出てくる単語の組合せをネットワーク化することで、文章の趣旨を明らかにしていきます。ドラマの人物相関図みたいに単語と単語のつながりをネットワーク化したものを作ります。 前回、…

Pythonを使って自然言語処理の前処理を行う

今回はテキストを使ってあんなことやこんなことをやるために、テキストを扱いやすい形に変換する方法を勉強します。準備の話で終わりなのですが、初デートに行こうと思ったらキャラクタTシャツしかなかったとにならないようにまさしく準備は大切ですよね。 …

Pythonでトピックモデル Word Cloud と LDA

SNSがコミュニケーションのインフラになりつつあることで、世の中は言葉で溢れています。この膨大な言葉の文章をまとめることで一つ一つの文章からはわからない傾向を新たに獲得することができます。具体的には、文章をカテゴライズして分類することで、どの…