来世は猫になる

スローライフで、生きてたい

【Python】beautifulsoupでよく出たエラー

 

スクレイピングをやってる過程で良く出たなーってエラーをまとめてみたのです。

 

では。

syntaxerror

構文エラーですから必ず直さないといけないやつ。

 

以下のエラー(例外)は直すのもそうだけど、仕方がないものに関しては例外処理で乗り切ったりする。

 

「try :

    まず実行する文

except 例外処理名 :

    条件に当てはまればexcept内を実行」

!!これ便利ですよね本当!!

 

TypeError :型のミスとかintとstrで足し算しちゃうとか

AttributeError:モジュール名とファイル名がかぶるとなる、あとスクレイピング時指定したタグがないとこのエラーが出てきた。

NameError:定義ミスとかimportし忘れとか

UnicodeDecodeError:文字コード違い、対象がshift_jisなのかutf-8なのかの見極め大事、ファイルなら適切な文字コードを指定して読み込む(encoding="utf-8"とか)

 

urllib.error.HTTPError:タイムアウトとか接続かな? 

urllib.error.URLError:タイムアウトとか接続かな?(核心はつけず)

http.client.IncompleteRead:Exceptionのサブクラスがなんとかとか書いてあってけど良くわからなかったやつ、ただスクレイピング時になる時とならない時があるし同じところでなるわけでもない、分からないからむしろ教えてほしい。ここまでくるとサイトも日本語が少なくなって英語の記事を読むことが増えた。読みはしたけども。(例外処理でexceptに記述するときはimport http.clientを忘れないこと、これで主はプチ悩んだ)

 

基本的に直せるとこは直して後は、exceptに例外名をぶち込んで解決しましたね。

(趣味レベルにおいては、現場はどうかわかりませんが)

 

まぁ例外処理の大切さですよね。プログラムを動作しきるためにも。

だいたいこれですね出てきたエラーは