ホーム＞機械学習＞教材

「テキストマイニングの基礎技術と応用」（岩波書店）の評判・価格・レビュー

機械学習を学ぶための教材の基本情報・価格・レビュー。

PR・広告を含みます

著者: 那須川哲哉/吉田一星/宅間大介/鈴木祥子/村岡雅康/小比田涼介／岩波書店
価格: 3850円 (楽天ブックス)
発売日: 2020年12月18日頃
楽天レビュー: 3.0（2件）

楽天ブックスで見る ›Amazonで見る ›

機械学習をスクールで学ぶなら、教育訓練給付で最大80%OFF。

対象講座なら受講料の最大80%（給付区分・上限・要件あり）が後日戻り、実質負担を抑えられます。独学の本＋スクールの併用も。
▶ あなたの講座でいくら戻るか試算（無料・30秒）

スクールリスキリング最大70%

データサイエンスブートキャンプ

データサイエンスを基礎から(リスキリング最大70%)

受講料約251,900円〜

無料で詳細・相談 ›評判・給付の詳しい解説 ›

スクール教育訓練給付最大80%

SHIFT TERAS CAMPUS東証上場SHIFTが運営

旧DMM WEBCAMP・教育訓練給付最大80%対象

受講料 910,800円 → 給付後約270,800円

✓ 条件を満たせば受講料全額返金の転職保証コースあり（規定あり）
無料相談で適用条件を確認できます

無料で詳細・相談 ›評判・給付の詳しい解説 ›

スクール教育訓練給付最大80%

ディープロ(DPro)

未経験→Webエンジニア・専門実践給付80%対象

受講料 797,800円 → 給付後約344,340円

✓ 規定の就職サポート後に内定なしなら受講料全額返金（規定あり）
無料相談で適用条件を確認できます

無料で詳細・相談 ›評判・給付の詳しい解説 ›

はじめての方へ：教育訓練給付のしくみと損しない選び方　／　申請手順5ステップ

学習・開発環境

ConoHa VPS

Linux・サーバー構築を実機で学べるVPS。時間課金で必要な時だけ立てて消せる。

512MB 月額460円〜（時間課金1.3円/時・初期費用0円）

公式で詳細 ›

学んだ後に「作って公開する」ための環境例です。サーバー・ツールは教育訓練給付／補助の対象外です。

※給付率・実質額は区分（一般20%／特定一般40%／専門実践最大80%）と要件で変わり、即時値引きでなく後日支給です。最終可否はハローワーク・厚労省でご確認ください。掲載はPR（送客手数料を受領）。

この本について

研究と実応用の両面に従事する研究者が、テキストデータを活用するための実践的なガイドを提供する。基盤技術に関する学術的な解説や活用事例にとどまらず、誰もが成果を出すことができるように、必要となる視点を示す。新しい研究トピックを取り上げることで今後のテキストマイニングの進化の方向性も展望する。はじめに

第1章テキストマイニングの基本 1. 1 テキストマイニングが可能にすること 1. 2 検索や分類とテキストマイニングの違い 1. 3 テキストマイニングの基本的な仕組み 1. 4 テキストマイニングの難しさ 1. 5 テキストマイニングのための自然言語処理 1. 6 テキストマイニングのための分析技術 1. 7 テキストマイニング成果を出すための留意点章末問題／参考文献

第2章テキストマイニングのための辞書構築 2. 1 テキストマイニング辞書の性質 2. 2 テキストマイニング辞書の構築支援 2. 3 対話的辞書構築支援システム 2. 4 終わりに章末問題／参考文献

第3章機械学習の応用による文書類似検索 3. 1 類似検索の概要 3. 2 類似検索の課題 3. 3 教師なし学習 3. 4 類似度と特徴ベクトルの定義 3. 5 単語から特徴へ 3. 6 検索漏れと自動分類 3. 7 ランキング学習 3. 8 終わりに章末問題／参考文献

第4章膨大なデータを高速処理する索引技術 4. 1 分析に必要なデータ量の求め方 4. 2 データを10 倍にすると分析効果は何倍になるか 4. 3 大量のデータを扱うためのインデクスとは 4. 4 テキスト分析におけるトップk クエリ 4. 5 DFP アルゴリズムによるランダムアクセスの回避 4. 6 「キーワードの大半は関連がないこと」を利用する技術 4. 7 カーディナリティフィルタのプログラミング 4. 8 インデクスから眺めたテキストデータ分析章末問題／参考文献

第5章テキスト分析のための実践的確率統計 5. 1 集計値に当てはめる確率モデル：二項分布 5. 2 集計値に当てはめるべき確率モデル：ポアソン分布 5. 3 不完全な抽出器のデータを用いた統計 5. 4 テキストデータ上の統計章末問題／参考文献

第6章顧客の声やSNS のテキストマイニング 6. 1 顧客の声のテキストマイニング 6. 2 SNSデータの分析章末問題／参考文献

第7章特許文書のテキストマイニング 7. 1 特許の概要 7. 2 特許分析の重要性 7. 3 特許文書のテキストマイニング 7. 4 特許文書のスコアリング 7. 5 請求項からの情報抽出 7. 6 類似特許検索 7. 7 語彙の関係性抽出 7. 8 終わりに章末問題／参考文献

第8章テキストと画像情報からの知識獲得 8. 1 はじめに 8. 2 物体の名称獲得 8. 3 画像を用いた具体名詞獲得 8. 4 文書への画像挿入 8. 5 終わりに章末問題／参考文献

章末問題解答索引

判型：全集・双書／シリーズ：テキストアナリティクス　第2巻

機械学習とは

機械学習は、データから規則性を学び、新しい入力に対して予測や分類を行う技術です。人が作る固定ルールとは異なり、モデルがデータの傾向をもとに判断基準を最適化します。実務ではデータ活用の共通基盤として、画像・文章・音声など多様な分野につながる入口です。

こんな人向け：想定読者は、プログラミングの基本操作ができるか、あるいはこれから始める読者です。統計や数学を完璧にしなくても進められますが、何を学んだかを言葉で説明しながら進める姿勢が有効です。

独学ロードマップでの位置

学習は、前提理解→実装→評価・改善の順に重ねるのが自然です。最初から難易度の高いテーマを扱うより、土台を分割して積む構成の方が長く読み続けやすいです。

Pythonの基本とデータの読み書き、可視化までを最初に反復する
確率・統計の基本概念を、式だけでなく用途と一緒に理解する
回帰や分類などの基礎手法を小規模データで手を動かして実装する
評価指標と検証設計を学び、結果の意味を読み解く練習をする
前処理・学習・評価の流れを回して、再現できる学習ノートを残す

独学で足りる？体系的に学ぶ選択肢

独学の肝は、教材選びより先に学習目的を言語化することです。理論説明、実装例、検証手順の三層が揃っている教材を選ぶと、知識が分断されにくくなります。公式や定理は最小単位で理解し、難所は図表や簡単なデータで自分の言葉に言い換えると定着が早まります。

独学が不安、または期限付きで進めたい場合は、学習計画が明文化されている体系的なコース形式を検討すると、継続の見通しが立てやすくなります。特に、進捗のチェック項目が明確で、誤りの原因を段階的に切り分ける設計は、独学の空白部分を埋めるのに向きます。 ▶ 給付でいくら戻るか試算

よくある質問

Q. 数学が苦手でも始められますか？

始めること自体は可能です。難しい式を最初に詰め込むより、なぜその手法が必要かを実データで確認しながら進める方が、理解の負担が下がります。必要な数学は、学習を進めるに連れて少しずつ補っていく順が現実的です。

Q. 読むだけで実務に役立つレベルになりますか？

読了だけでは知識は増えますが、実務で再現する力は別です。各章で実際にデータを処理し、結果を可視化・解釈するまで行うと移行しやすくなります。運用では、モデルの前提条件と限界を説明できることが重要です。

Q. 最初に避けるべき勉強の失敗は何ですか？

概念よりも用語やアルゴリズム名を先に覚えすぎると、全体像を失いやすくなります。データ前処理や評価を飛ばすと、後で調整しても原因が分からなくなります。小さな題材で一連の流れを回し、意図と結果をセットで確認する習慣を先に作るのが安全です。

次の一冊：次に読む方向としては、データ基盤の整備や可視化の理解を深める本が有効です。あわせて、深層学習の導入とモデルの説明性・運用管理へ進むと、機械学習の理解領域が実務寄りに広がります。

機械学習の関連教材

人工知能は人間を超えるかディープラーニングの先にあるもの

人工知能はどのようにして「名人」を超えたのか？

1650円

サイバネティックス（ウィーナー）

1276円

大学4年間のデータサイエンスが10時間でざっと学べる

1650円

機械学習の教材をもっと見る ›