書籍『Pythonによるスクレイピング&機械学習 開発テクニック』のサポートページ *

ここは、牛丼の写真からカロリーを算出してみよう!など、キャッチーな例題を掲載した、スクレイピングと機械学習の書籍のサポートページです。BeautifulSoup,scikit-learn,TensorFlowなど、さまざまなライブラリを実践で使うことに重きを置いています。

書籍のフォロー *

  • [Q1] WindowsとDockerを使った環境構築で、日本語が文字化けしたり、表示されないという問題が発生します。
    • [A1] いろいろ調べてみると、Docker for Windowsで、まれにマルチバイト文字が表示されないという問題があるでそうです。そこで、解決策としては、ConEmuなどの、DOSプロンプト以外のWindowsターミナル環境を使うと直るそうです。
  • [Q2] Windows環境では、python3/pip3ではなく、python/pipを使うようですが・・・
    • [Q2] 本書のプログムは、Python3を対象にしています。pythonコマンドのバージョンがPython3であれば、そのまま利用できます。

誤植情報 *

申し訳ありません、誤植がありました。

2017/03/15 - p.71付近、書籍でソースコードの部分 *

  • [x] 「from selenium import Webdriver」
  • [o] 「from selenium import webdriver」

2017/03/01以前の誤植情報 *

ソースコード: src/ch2/selenium-capture.py *

プログラムの一行目のfromの前にスペースが入っていました。スペースを削除すると動きます。

p.114 JSON形式を書き出す *

  • 編集時に入ったコメント「※※※なにかせつめいを※※※」がそのまま残ったままでした。
  • →以下のコマンドを実行すると、Pytyhonの辞書形式データをJSONデータとして出力します。

ソースコード: src/ch3/yaml-io.py *

コメント部分にタイポ

  • [x] # PythoのデータをYAMLで出力
  • [o] # PythonのデータをYAMLで出力

p.245 タイポ *

  • [x] Pandas の配列データはをそのまま使えないので
  • [o] Pandas の配列データはそのまま使えないので

p.275 タイポ *

  • [x] 後者の確率的言語モデルを利用した形態素解析が多く多く、精度も高くなっています。
  • [o] 後者の確率的言語モデルを利用した形態素解析が多く精度も高くなっています。

p.275以降、3つの図の下のキャプションがおかしい *

先頭の図が「ぬけ」となっており、その後、図のキャプションが一つずつずれています。本来図の下のキャプションは次のようになるはずです。

  • [o] 「Python」の類似語を列挙したところ...近しいプログラミング言語が列挙された
  • [o] 「カレー」の類似語を列挙したところ...どれも美味しそう
  • [o] 「岡村」という名字の類義語を列挙したところ...関連人物が出た

p.279 ベイズの定理の式 *

崩れてしまっていますが、正しくは、以下の式が正しいです。

bayes.png

p.290 ソースリストの修正 *

P.290 ~291のソースリスト「src/ch6/mlp3-classify.py」において、原稿執筆時に入力に使ったデータのパラメータが変わったため、入力データの不整合が発生しておりました。「mlp3-classify.py」を以下のように修正すると動作します。

# 最大単語数を指定
max_words = len(X[0])

このほかの部分も見直し、以下のように修正したファイルをzip形式でアップロードしてありますので、ご利用下さい。

9行目のmax_wordの定義を削除し、
16行目に、global max_wordsを追加
34行目に、max_words = len(X[0])を追加
http://www.socym.co.jp/download/1079/mlp3-classify.zip

p.320 コマンドラインの指定 *

タイポでした。

  • [x] $ python3 python3 avhash.py
  • [o] $ python3 avhash.py

P.387 余白の部分に以下を追加 *

  • [日本語がうまく表示されない問題に対処する]
  • Docker for Windows で、まれにマルチバイト文字が表示されないという問題があるようです。その場合、ConEmuなどの、DOSプロンプト以外のWindowsターミナル環境を使うと解決されます。
ConEmu
[URL] https://conemu.github.io/

ご質問がある方は... *

本ページのコメント欄に、質問を書くと収集がつかなくなってしまいます。ご質問がある方は、「出版社のサポートページ」あるいは「くじらはんど・お問い合わせフォーム」でご連絡ください。