テキストマイニング分析結果の利用について

テレビ番組や新聞・雑誌等の記事内で、分析した結果を掲載することはできますか?

テレビ番組、新聞、雑誌、Webサイトの媒体、YouTube動画にて、当テキストマイニングツールの分析結果画面を掲載なさりたい場合、出典としてツール名を明記していただければ、無料にてご利用いただけます。

【クレジット表記例】
※ ユーザーローカル テキストマイニングによる分析( https://wordcloud.userlocal.jp/
※ ユーザーローカル大容量テキストマイニングツールで調査 https://wordcloud.userlocal.jp/

ご利用時には媒体名、掲載予定日、概要のご報告を弊社利用報告フォームにご報告いただけますと幸いです。 今後のツール機能強化の参考とさせていただきます。

テキストマイニング結果を、論文や学会発表、レポートに掲載していいですか?

はい。 テキストマイニング結果は、許諾なく論文などで無料で使用いただけます。 これまでも多くの学生・研究者の方にご利用いただいております。 ご利用時は、論文中、脚注や参考文献等に、弊社ツール名とURLを記載してください。

【記述例】
※ ユーザーローカル テキストマイニングツール( https://wordcloud.userlocal.jp/ )による分析

論文をWebで公開する場合、そのURLを弊社利用報告フォームにご報告いただけますと幸いです。 今後のツール機能強化の参考とさせていただきます。

入力したデータの内容が勝手に公開されることはありますか?

テキストマイニングツールでご入力いただいた情報は、お試しになったご本人様が結果URLを外部に公開しないかぎり勝手に公開されることはございません。ご安心いただければと思います。

データに関する質問

「スコア」とはなんですか?

スコアは、その単語の「重要度」を表す値です。以下で、スコアがなぜ必要なのかと、その算出方法についてご紹介します。

一般的な文書では、単語の出現回数だけでいえば「今日」や「思う」「ある」などといった、”ごく一般的な単語”が何度も出現してしまいます。 ただ、このような単語は、どういった文書にも出現する単語であるため、たとえ出現回数が多いとしても、意味が薄い、あまり重要ではない単語といえます。 単純に回数だけをランキング化しても、一般的な語が混じってしまいその文章の特徴をつかむことができません。

この問題を解決するため、テキストマイニングでは、「一般的な文書でよく出る単語は、重要ではないため、重み付けを軽くする」、いっぽう「一般的な文書ではあまり出現しないけれど、調査対象の文書だけによく出現する単語は重視する」仕組みを取り入れています。

こういった特徴語を抽出するためのロジックとして、一般的にTF-IDF法という統計処理をします。

この手法によって、出現回数だけでなく、重要度を加味した値が「スコア」です。スコアが高い単語は、そのテキストを特徴づける単語であるといえます。