ファイルが同じかどうかを比較するにはハッシュが便利です。
ハッシュはデータの並びの特徴を表した数値です。
その値が同じであれば、データが同じである確率がとても高くなります。
コード
下記のソースでは指定されたフォルダ(4行目)内に同じ内容のファイルがある場合、そのファイルを表示します。
今回は「SHA256」という種類のハッシュで計算しました。
1 | import os, sys, glob, hashlib |
13行目のコメントアウトを外すと重複したファイルを消すことができます。
ファイルが同じかどうかを比較するにはハッシュが便利です。
ハッシュはデータの並びの特徴を表した数値です。
その値が同じであれば、データが同じである確率がとても高くなります。
下記のソースでは指定されたフォルダ(4行目)内に同じ内容のファイルがある場合、そのファイルを表示します。
今回は「SHA256」という種類のハッシュで計算しました。
1 | import os, sys, glob, hashlib |
13行目のコメントアウトを外すと重複したファイルを消すことができます。
特定のフォルダにファイルを置くと自動的になにか処理を行うと便利です。
例えば、ファイルを置くとそれを自動で印刷したり、メールをしたりする場合などです。
今回はWatchDogというライブラリを使って、フォルダを監視する方法をご紹介します。
まずは次のコマンドを実行して、WatchDogライブラリをインストールします。
1 | pip install watchdog |
次の通りコーディングを行います。
1 | from watchdog.events import FileSystemEventHandler |
| メソッド | 内容 |
|---|---|
| on_any_event | 全てのイベントを監視 |
| on_created | 作成イベントを監視 |
| on_deleted | 削除イベントを監視 |
| on_modified | 変更イベントを監視 |
| on_moved | 移動イベントを監視 |
監視フォルダにファイルを作ったり、削除したり、編集したりすると次のようにイベントを検知することができます。

Pythonでは「dircmp関数」を使うと、2つのフォルダにどのような差異があるのかを簡単に調べることができます。
「dircmp関数」は標準ライブラリなので、インストールをする必要はありません。
次のコードでは、2つのフォルダを比較し3種類の差異を表示します。
1 | import os |
実行結果は下記のようになります。

ただファイル内容の差異表示に関しては、確認しづらくあまり実用的ではないかもしれません。
Twitter APIを利用するとPythonからツイートしたり、ツイートの一覧を取得したりすることができます。
まずTwitterにサインインしてから次のURLにアクセスします。
Twitterアプリケーション - https://apps.twitter.com/
Twitter APIを利用するためにはアプリケーションを登録する必要があります。
ブラウザ右上の「Create an app」をクリックします。

①App Name
アプリケーション名です。ほかのアプリケーション名と被らないように一意にする必要があります。
②Application description
アプリケーションの説明です。
③URL
自分のサイトがあればそのURLを入力します。なければ存在しないURLでも問題ありません。
④Tell us how this app will be used
Twitter関係者へアプリケーションをどのような用途で使うのかを説明するようです。適当でかまいません


問題なければ「Create」ボタンを押します。

アプリケーションが問題なく登録されると下記のようなページに移動します。

「Kyes and tokens」をクリックします。
ここではTwitter APIを実行するときに必要なアクセスキーとトークン情報を確認することができます。

Twitter APIを実行する際に必要な情報は次の4つです。
アクセストークンに関しては「generate」または「Regenerate」をクリックすると表示されます。
コンソールから次のコマンドを実行し、Twitterライブラリをインストールします。
1 | pip install python-twitter |
Pythonで次のコードを実行します。
1 | import twitter |
パラメータにはアプリケーション情報から対応したキー情報を設定します。

Twitter APIを使うとツイートだけではなく、ツイート一覧を取得することもできます。
「screen_name」にはツイート一覧を取得するTwitterユーザ名を設定してください。
1 | import twitter |
デフォルトで一度に取得できるツイート数は200個です。
「ReportLab」というライブラリを使ってPythonからPDFファイルを出力してみます。
ReportLab - https://www.reportlab.com/
まず「ReportLab」をインストールします。
1 | pip install reportlab |
一番簡単にファイル出力するコードは下記の通りです。
1 | from reportlab.pdfgen import canvas |

PythonでPDFからテキストを出力してみます。
「pdfminer3k」というライブラリを使います。
まず「pdfminer3k」をインストールします。
1 | pip install pdfminer3k |
Pythonがインストールされているフォルダ配下のScriptフォルダに「pdf2txt.py」というユーティリティ・プログラムが置かれます。
このプログラムを使ってPDFからテキストを出力します。
ネット上にあったシンプルなPDFファイルをダウンロードし入力としました。
1 | python pdf2txt.py 7a79c35f7ce0704dec63be82440c8182.pdf |
上記のように実行すると、PDFファイルをテキスト化したものが画面に表示されます。
画面のスクリーンショットをとる場合、「PrtSc」キーを押すことはよく知られています。
ただこれをファイルに保存する場合、いったん「ペイント」などのソフトに貼り付けてからファイル保存をする必要があり少々手間がかかります。
そこで今回はショートカットキーを使って一発でスクリーンショットをファイルに保存する方法をご紹介します。
[Win + PrtSc]を押します・・・・・これだけです。
ファイルの保存先は「ピクチャ」フォルダの中の「スクリーンショット」フォルダです。
PNG形式で、ファイル名は自動的に連番が降られて保存されます。
とても簡単なので一度試して頂ければ幸いです。
(ただ画面全体の保存にしか対応していないのが少々残念です)
PythonとSeleniumを使ってWebサイトの画面キャプチャを撮ってみます。
pipコマンドを使って、「Selenium」をインストールします。
1 | pip install selenium |
下記サイトからChromeDriverをダウンロードし、パスが通った場所に格納します。
ChromeDriver - ダウンロードはこちらから
ChromeDriverのバージョンは、各環境にインストールされているChromeブラウザのバージョンと合わせる必要がありますので注意して下さい。
Pythonで実装します。
1 | import time, selenium.webdriver |
実行するとChromeブラウザが起動され、スクリーンショットが撮られます。
下記が自動的に取得されてたスクリーンショット画像です。

URLをリスト化して複数のWebサイトを自動的に取得するなどいろいろ応用ができると思います。
このごろ話題になっているAmazonでの「サクラレビュー」。
今回はサクラレビューを判定するサイトをご紹介します。
サクラチェッカー - https://sakura-checker.jp/
サクラチェッカーでは「サクラ度」のほかに下記の注意度を判定することができます。
ブラウザを開き上記リンクからサクラチェッカーを開きます。

今回は私が持っている「Aero Book」で検索してみます。
1年ほど前に購入したときは55,000円だったので少し値下がりしたようです。
type-Cで充電できるのが意外とうれしいです。
サクラ度判定結果は以下の通りです。


まー個人的には普通に使えてるし、値段の割にはスペック高めでサクサク動くのでレビュー低くてもショックじゃありません。 ( T T )
ただキーレイアウトに慣れないのとバッテリーがあまり持たないことがやや不満でしょうか。
サクラ度(注意度)の詳細分析も出ています。
「ショップレビュー」と「レビュー&レビュア」が特に気にすべき項目になるでしょうか。
(思いっきり危険度95%となっているんですが・・・)
急ぎの用事で資料を印刷したいのに、インク切れア故障でプリンターが使えない場合、セブンイレブンの「ネットプリント」を活用して印刷することができます。
ネットプリント - https://www.printing.ne.jp/index_p.html
上記URLより「ネットプリント」へ移動し、「ユーザ登録なしでプリントする」をクリックします。

「今すぐファイル登録」をクリックします。

「同意する」にチェックを入れ、「利用を開始する」をクリックします。

①プリント用紙を選択し、②で印刷するファイルを登録します。
次に③用紙サイズを選択し、④「登録する」ボタンをクリックします。
(その他の選択は必要に応じて行ってください。)

正常にファイル登録ができると下記のダイアログが表示されます。

登録したファイルがファイル登録履歴に表示されるので、プリント予約番号をメモしておきます。
予約番号はメールで通知しておくこともできます。

セブンイレブンのマルチコピー機で、「プリント」→「ネットプリント」を選択し「プリント予約番号」を入力すると登録したファイルを印刷することができます。