Python × AI [クラスタリング] - 調整ランド指数と正解率

前回クラスタリングを行った結果を、調整ランド指数(Adjusted Rand Index)正解率(Accuracy)という代表的な指標で評価してみます。

2つの指標とも最良の場合に1を返し、関係のないクラスタリングの場合0を返します。

調整ランド指数と正解率で評価

調整ランド指数と正解率で評価を行うためのコードは下記の通りです。

調整ランド指数の算出にはadjusted_rand_score関数を使い、正解率の算出にはaccuracy_scoreを使います。

引数としては両関数とも正解データ予測結果のクラスタ番号を渡しています。

[Google Colaboratory]

1
2
3
4
5
6
from sklearn.metrics import accuracy_score
from sklearn.metrics import adjusted_rand_score
ari = "ARI: {:.2f}".format(adjusted_rand_score(iris.target, cls_data["cluster"]))
accuracy = "Accuracy: {:.2f}".format(accuracy_score(iris.target, cls_data["cluster"]))
print(ari)
print(accuracy)

[実行結果]

調整ランド指数(ARI)は、同じクラスタに属すべきデータ同士が正しく同じクラスタに属しているかどうかを表す指標です。

0.73という結果になっており、まあまあの良い結果だと思います。

正解率(Accuracy)は、クラスタラベルと正解データとの完全一致を表す数字です。

0.01という結果はぜんぜん一致しないことを表していますが、これはラベルとクラスタリングでの予測結果であるクラスタ番号が一致していないことが原因であると思われます。

Python × AI [クラスタリング] - k-means法

前回読み込んだアイリスデータを参照しk-means法でクラスタリングを行います。

クラスタ数(グループ数)

k-means法では、クラスタ数(グループ数)を指定する必要があります。

今回のデータではクラスタ数が3種類(’setosa’、’versicolor’、’virginica’)であることがあらかじめわかっているので問題ありませんが、最適なクラス数は分からないことがほとんどであり、実際の運用や評価を実施して決めることになります。

k-means法

k-means法は、各データ間での距離をもとにグループを分けていく手法です。

最初に適当なクラスタ(グループ)に分けて、クラスタの平均を用いてうまくデータが分かれるように調整していきます。

k-meansの実行

k-meansを実行します。

k-meansのモデルを生成する際のパラメータは以下の通りです。(2行目)

  • n_clusters
    クラスタ数。
    ‘setosa’、’versicolor’、’virginica’の3種類に分類するため3を指定。
  • random_state
    乱数シード。
    固定値を指定しないと毎回結果が変わってしまう。
  • init
    クラスタセンター(セントロイド)の初期化方法。
    基本的なk-meansの結果を得るために“random”を指定。

あとはfit関数にデータを渡すだけで、クラスタリングのモデル構築は完了です。(4行目)

[Google Colaboratory]

1
2
3
4
from sklearn.cluster import KMeans
model = KMeans(n_clusters=3, random_state=0, init="random")
cls_data = df_iris.copy()
model.fit(cls_data)

[実行結果]

クラスタの予測結果取得

クラスタの予測結果を取得するソースコードは以下の通りです。

predict関数で予測結果を取得することができます。

[Google Colaboratory]

1
2
cluster = model.predict(cls_data)
print(cluster)

[実行結果]

各データに対して0, 1, 2というようにクラスタリングのクラスタ番号が出力されます。

予測結果をグラフ化

予測した結果をグラフ化します。

[Google Colaboratory]

1
2
cls_data["cluster"] = cluster
sns.pairplot(cls_data, hue="cluster")

[実行結果]

視覚的に3つのクラスタ(グループ)にまとまっていることが分かります。。

クラスタセンターの取得

model.cluster_centers_で、それぞれのクラスタの中心を取得することができます。

[Google Colaboratory]

1
2
3
cluster_center = pd.DataFrame(model.cluster_centers_)
cluster_center.columns = cls_data.columns[:4]
display(cluster_center)

[実行結果]

クラスタセンターのグラフ表示

クラスタセンターをグラフに表示してみます。

“sepal length”と”sepal width”の2変数に関して、データとクラスタセンターを表示します。

[Google Colaboratory]

1
2
3
4
plt.scatter(cls_data["sepal length (cm)"], cls_data["sepal width (cm)"],c=cls_data["cluster"])
plt.xlabel("sepal length (cm)")
plt.ylabel("sepal width (cm)")
plt.scatter(cluster_center["sepal length (cm)"], cluster_center["sepal width (cm)"], marker="*", color="red")

[実行結果]

赤い★マークで表示されているのが、各クラスタを構成しているクラスターセンターの位置になります。

クラスタ番号で集計した説明変数の平均値

クラスタリングの結果を確認します。

クラスタ番号で集計を行い、説明変数の平均を表示します。

[Google Colaboratory]

1
display(cls_data.groupby("cluster").mean().round(2))

[実行結果]

正解データとの比較

正解データと合わせて、答え合わせを行います。

確認しやすいように花の種類を設定して、花の種類で集計して平均を表示します。

[Google Colaboratory]

1
2
3
4
5
cls_data["target"] = iris.target
cls_data.loc[cls_data["target"] == 0, "target"] = "setosa"
cls_data.loc[cls_data["target"] == 1, "target"] = "versicolor"
cls_data.loc[cls_data["target"] == 2, "target"] = "virginica"
display(cls_data.groupby("target").mean().round(2))

[実行結果]

cluster列にはクラスタ番号の0, 1, 2が表示されています。

4つの変数がすべて一致しているsetosaはクラスタ番号2で全て正しくクラスタ化されていることが分かります。

versicolorvirginicaですが、4つの変数が完全に一致しているわけではありませんが、近い数字にはなっているのでそれなりにクラスタ化されているかと思います。

次回は、調整ランド指数正解率を使ってクラスタリングの結果を評価してみます。

Python × AI [クラスタリング] - データ準備編

データをグルーピングするクラスタリングを行いたいと思います。

今回はクラスタリングを行うデータを準備し、次回はk-means法でクラスタリングを行います。

実行環境としてGoogle Colaboratoryを使います。

アイリスデータの読み込み

sklearn.datasetsに用意されているアイリスデータのデータセットを読み込みます。

アイリスとは「あやめ」という花のことで、花びら(Petal)とがくの長さ(Sepal)で種類を分けることができます。

[Google Colaboratory]

1
2
3
4
5
6
7
8
import pandas as pd
from sklearn.datasets import load_iris
import matplotlib.pyplot as plt
%matplotlib inline

iris = load_iris()

iris.data.shape

[実行結果]

データの形状は、150個のサンプルデータがあり、サンプルごとに4種類の変数があることが分かります。

アイリスデータの花の種類

アイリスデータの花の種類を確認します。

[Google Colaboratory]

1
print(iris.target_names)

[実行結果]

‘setosa’、’versicolor’、’virginica’という3種類があることが分かりました。

データフレームに格納

データを扱いやすくするために、データフレームに格納します。

iris.dataで4変数のデータを取得し、columnsにiris.feature_nameを代入することで、カラム名に変数を指定しています。

[Google Colaboratory]

1
2
df_iris = pd.DataFrame(iris.data, columns = iris.feature_names)
df_iris.describe()

describe関数を実行すると、平均値・最小値・最大値などデータの全体像を確認することができます。

[実行結果]

データ数は欠損値がなく全て150個で、平均としてはがく(Sepal)の長さが一番広く、花びら(Petal)の幅が一番せまいことなどが分かります。

データの可視化

pairplot関数を使って、各変数のペアごとに散布図を表示します。

[Google Colaboratory]

1
2
3
import seaborn as sns
df_temp = df_iris.copy()
sns.pairplot(df_temp)

[実行結果]

一番確認しやすい傾向としては、petal lengthpetal widthの関係性が右肩上がりになっていることです。

次回は、今回読み込んだデータを参照しk-means法でクラスタリングを行います。

pingコマンド - 相手と相通できるかどうかを確認

pingコマンドとは

pingは通信相手との疎通を確認するためのコマンドです。

通信相手のIPアドレスかドメイン名を指定して実行し、ネットワーク経路に異常がないかどうかを調べることができます。

よく使うオプションは以下の通りです。

オプション内容
-a名前解決を行い、結果にドメイン名を表示
-i TTLエコー要求パケットの有効期限(TTL)を指定
-l サイズエコー要求パケットのサイズをバイト単位で指定
-n 回数コマンドを1回実行したときに送信するエコー要求パケットの回数を指定
-tCtrl+Cを押すまで、エコー要求パケットを続けて送信

ping実行

pingコマンドを実行してみます。

まずは同一セグメント内にあるWindowsパソコンのIPアドレスを指定します。

[コンソール]

1
ping 10.200.241.47

[実行結果]

1
2
3
4
5
6
7
8
9
10
10.200.241.47 に ping を送信しています 32 バイトのデータ:
10.200.241.47 からの応答: バイト数 =32 時間 <1ms TTL=128
10.200.241.47 からの応答: バイト数 =32 時間 <1ms TTL=128
10.200.241.47 からの応答: バイト数 =32 時間 <1ms TTL=128
10.200.241.47 からの応答: バイト数 =32 時間 <1ms TTL=128

10.200.241.47 の ping 統計:
パケット数: 送信 = 4、受信 = 4、損失 = 0 (0% の損失)、
ラウンド トリップの概算時間 (ミリ秒):
最小 = 0ms、最大 = 0ms、平均 = 0ms

問題なく疎通できました。

TTLと表示されているのはエコー応答パケットのもので、Windowsの場合128が表示されます。


次にルータを1つはさんだ先にあるLinuxサーバのIPアドレスに対してpingコマンドを実行してみます。

[コンソール]

1
ping 172.40.8.46

[実行結果]

1
2
3
4
5
6
7
8
9
10
172.40.8.46 に ping を送信しています 32 バイトのデータ:
172.40.8.46 からの応答: バイト数 =32 時間 =5ms TTL=63
172.40.8.46 からの応答: バイト数 =32 時間 =20ms TTL=63
172.40.8.46 からの応答: バイト数 =32 時間 =7ms TTL=63
172.40.8.46 からの応答: バイト数 =32 時間 <1ms TTL=63

172.40.8.46 の ping 統計:
パケット数: 送信 = 4、受信 = 4、損失 = 0 (0% の損失)、
ラウンド トリップの概算時間 (ミリ秒):
最小 = 0ms、最大 = 20ms、平均 = 8ms

これも問題なく疎通できました。

macOSやLinuxの場合、TTLは64が表示されるのですが経由したルータの数が引かれて63となっています。

つまり、TTLの数字をみることで通信相手のOSと経由しているルーターの数がわかることになります。


参考までに疎通ができない場合は、下記のような結果が表示されます。

[到達できないケース]

1
2
3
4
5
6
7
8
192.168.0.1 に ping を送信しています 32 バイトのデータ:
192.168.0.26 からの応答: 宛先ホストに到達できません。
192.168.0.26 からの応答: 宛先ホストに到達できません。
192.168.0.26 からの応答: 宛先ホストに到達できません。
192.168.0.26 からの応答: 宛先ホストに到達できません。

192.168.0.1 の ping 統計:
パケット数: 送信 = 4、受信 = 4、損失 = 0 (0% の損失)、

tracertコマンド - 経路上のルーターを表示

tracertコマンドとは

tracertは、コマンドを実行したパソコンから通信相手までの経路上にあるルーターを一覧表示するコマンドです。

経由するルーターが近い方から順番に表示されるため、相手にパケットが届くまでの経路が分かります。

通信相手にアクセスできない場合に、どのルーターに問題があるのかを調べる際に役立ちます。

ルーター情報

次のようなルーターの情報が表示されます。

  • TTL(有効期限) [1列目]
    TTLはTime To Liveの略で、パケットの有効期限を意味します。
    機器を1つ経由するごとに数字を1つ減らし、0になったらその時点で中継を止めます。
    パケットが永久に放浪する事態を回避するのが目的です。
  • 応答時間 [2~4列目]
    パソコンから各ルーターにICMPのエコー要求パケットを送ってからエコー応答パケットが返ってくるまでの応答時間です。
    応答時間の測定は、各ルーターごと3回ずつ実施されます。
    4秒以内に応答がない場合は、*が表示されます。
  • IPアドレスまたはドメイン名とIPアドレスのセット [5列目]
    4秒以内に応答がない場合は、「要求がタイムアウトしました」と表示されます。

tracert実行

試しにgoogleに対してtracertコマンドを実行してみます。

[コンソール]

1
tracert google.com

[実行結果]

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
google.com [2404:6800:4004:813::200e] へのルートをトレースしています
経由するホップ数は最大 30 です:

1 2 ms 2 ms 2 ms 2400:4050:7c0:3a00:826a:efff:fe31:bd72
2 3 ms 3 ms 117 ms 2400:4050:7c0:3a00::fffe
3 * * * 要求がタイムアウトしました。
4 * * * 要求がタイムアウトしました。
5 6 ms 5 ms 5 ms 2001:380:a120:2e::1
6 8 ms 6 ms 6 ms 2001:4860:1:1::21f5
7 5 ms 7 ms 5 ms 2404:6800:8042::1
8 * * * 要求がタイムアウトしました。
9 6 ms 7 ms 7 ms 2001:4860:0:1::14b9
10 5 ms 5 ms 5 ms nrt20s17-in-x0e.1e100.net [2404:6800:4004:813::200e]

トレースを完了しました。

上記の例では問題なくパケットは目的のサーバに届いています。

経路の途中で「要求がタイムアウトしました。」と表示されており、応答のなかったルーターが3台あったことが分かります。

これはICMPを無効にしている機器の可能性がありますが、tracertコマンドではそのような機器が途中にあっても、処理を続けるため最終的には通信相手までの経路が分かります。

よく使うオプション

よく使うオプションは以下の通りです。

オプション内容
-dIPアドレスの名前解決を行わない。
-w ミリ秒タイムアウト時間をミリ秒で指定する。
-h ルータ数経由するルータの数を指定する。

tracertの動作

tracertコマンドが宛先までの経由を調べる仕組みは下記の通りです。

  1. tracertが実行されたらTTLを「1」に設定したエコー要求パケットを送信する。
    TTLを1つずつ増やしながら順にこれを規定回数繰り返すか、宛先からエコー応答パケットが届くまで届ける。
  2. ルーターは届いたパケットのTTLを1つ小さくする。
  3. ルーターはTTLが0のパケットを時間切れのパケットとして送信元に通知する。
  4. ルータによっては、応答しない設定になっていることもある。
  5. ルーターが応答を返さなくても、その後のルータが応答することもある。
  6. 宛先の機器にエコー要求パケットが届いたら、その機器はエコー応答パケットを返す。
  7. 時間超過パケットやエコー応答パケットが届くと、エコー要求パケットを送ってから届くまでにかかった時間とそのパケットの送信元を表示する。

ipconfigコマンド - リゾルバーキャッシュの表示と削除

DNSリゾルバーキャッシュとは

Windowsパソコンでは、IPアドレスFQDNのキャッシュを保持しています。

(FQDNとは、ホスト名とドメイン名を省略しないで表示したものです)

IPアドレスとFQDNのキャッシュとは、Windowsで管理しているIPアドレスとFQDNの対応表のことでDNSリゾルバーキャッシュと呼ばれます。

通信フロー

FQDNで指定された相手と通信する場合、次のようなフローになります。

  1. DNSリゾルバーキャッシュを参照し、FQDNに対応するIPアドレスがあるかどうかを確認する。
  2. 一致するFQDNがあれば、それに対応するIPアドレスを使って通信を開始する。
  3. 一致するFQDNがなければ、DNSサーバに問い合わせを行う。
  4. DNSサーバに問い合わせた名前解決の結果をWindowsシステムの内部に保持し、外部のDNSサーバへの問い合わせをなるべく減らす。

DNSリゾルバーキャッシュの保持時間

DNSリゾルバーキャッシュのデータの保持時間は、初期設定で1日となっています。

この時間を過ぎればキャッシュは破棄されます。

(OSを再起動した場合もキャッシュのデータはクリアされます)

DNSリゾルバーキャッシュの表示

FQDNで指定した相手と通信できない場合、DNSリゾルバーキャッシュのデータが古くなっている可能性があります。

その場合は、DNSリゾルバーキャッシュを表示してキャッシュの内容を確認してみましょう。

[コンソール]

1
ipconfig /displaydns

[実行結果(例)]

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
Windows IP 構成

gbc6.jp2.as.criteo.com
----------------------------------------
レコード名 . . . . . . . : gbc6.jp2.as.criteo.com
レコードの種類 . . . . . : 1
Time To Live . . . . . .: 14776
データの長さ . . . . . . : 4
セクション . . . . . . . : 回答
A (ホスト) レコード. . . : 116.213.22.169


レコード名 . . . . . . . : gbc6.jp2.as.criteo.com
レコードの種類 . . . . . : 1
Time To Live . . . . . .: 14776
データの長さ . . . . . . : 4
セクション . . . . . . . : 回答
A (ホスト) レコード. . . : 116.213.22.187


レコード名 . . . . . . . : gbc6.jp2.as.criteo.com
レコードの種類 . . . . . : 1
Time To Live . . . . . .: 14776
データの長さ . . . . . . : 4
セクション . . . . . . . : 回答
A (ホスト) レコード. . . : 116.213.22.192


レコード名 . . . . . . . : gbc6.jp2.as.criteo.com
レコードの種類 . . . . . : 1
Time To Live . . . . . .: 14776
データの長さ . . . . . . : 4
セクション . . . . . . . : 回答
A (ホスト) レコード. . . : 116.213.22.190


レコード名 . . . . . . . : gbc6.jp2.as.criteo.com
レコードの種類 . . . . . : 1
Time To Live . . . . . .: 14776
データの長さ . . . . . . : 4
セクション . . . . . . . : 回答
A (ホスト) レコード. . . : 116.213.22.184
(・・・途中略・・・)

DNSリゾルバーキャッシュの削除

IPアドレスとFQDNの対応付けが間違っている場合は、下記のコマンドでDNSリゾルバーキャッシュの削除を行うことができます。

[コンソール]

1
ipconfig /flushdns

[実行結果]

1
2
3
Windows IP 構成

DNS リゾルバー キャッシュは正常にフラッシュされました。

その後、FQDNでアクセスを行うとDNSサーバへの問い合わせが行われ、正しいIPアドレスを取得してキャッシュに保持されます。

これで正しく通信ができるようになるはずです😀

netstatコマンド - ポートごとの通信状況を表示

netstatは、コンピュータの通信状況を一覧表示するコマンドです。

接続ごとに下記の情報を表示することができます。

  • プロトコル
  • 自分のIPアドレスと通信に使っているポート
  • 通信相手の名前と使っているポート
  • 状態
    LISTENING(待ち受け状態)⇒ESTABLISHED(通信の確立)⇒ CLOSING(通信の終了手続き中)⇒ TIME_WAIT(タイムアウト待ち)⇒ CLOSED(通信の終了)⇒LISTENINGに戻る。

netstatコマンド実行

netstatをオプションなしで実行すると、何らかの通信が始まったTCPのポート(終了処理中を含む)を一覧表示します。

[コンソール]

1
netstat

実行例は以下の通りです。

[実行結果(例)]

1
2
3
4
5
6
7
8
9
10
11
12
13

アクティブな接続

プロトコル ローカル アドレス 外部アドレス 状態
TCP [240b:c020:4d0:32ae:1106:be43:8832:7dcf]:49956 us:https CLOSE_WAIT
TCP [240b:c020:4d0:32ae:1106:be43:8832:7dcf]:50412 tp-in-f188:5228 ESTABLISHED
TCP [240b:c020:4d0:32ae:1106:be43:8832:7dcf]:51835 server-13-249-157-166:https ESTABLISHED
TCP [240b:c020:4d0:32ae:1106:be43:8832:7dcf]:54850 [64:ff9b::14c7:7855]:https ESTABLISHED
TCP [240b:c020:4d0:32ae:1106:be43:8832:7dcf]:54963 [64:ff9b::68f4:2a82]:https ESTABLISHED
TCP [240b:c020:4d0:32ae:1106:be43:8832:7dcf]:58107 [64:ff9b::68f4:2ac1]:https ESTABLISHED
TCP [240b:c020:4d0:32ae:1106:be43:8832:7dcf]:62041 lb-006:https ESTABLISHED
TCP [240b:c020:4d0:32ae:1106:be43:8832:7dcf]:62847 tp-in-f188:5228 ESTABLISHED
TCP [240b:c020:4d0:32ae:1106:be43:8832:7dcf]:63889 us:https ESTABLISHED

-aオプションを付けて実行すると、待ち受け状態(LISTENING)やUDPを含むすべてのポートを表示します。

[コンソール]

1
netstat -a

実行例は以下の通りです。

[実行結果(例)]

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50

アクティブな接続

プロトコル ローカル アドレス 外部アドレス 状態
TCP 0.0.0.0:135 LAPTOP-MC79IJF9:0 LISTENING
TCP 0.0.0.0:445 LAPTOP-MC79IJF9:0 LISTENING
TCP 0.0.0.0:4000 LAPTOP-MC79IJF9:0 LISTENING
TCP 0.0.0.0:5040 LAPTOP-MC79IJF9:0 LISTENING
TCP 0.0.0.0:7680 LAPTOP-MC79IJF9:0 LISTENING
TCP 0.0.0.0:49664 LAPTOP-MC79IJF9:0 LISTENING
TCP 0.0.0.0:49665 LAPTOP-MC79IJF9:0 LISTENING
TCP 0.0.0.0:49666 LAPTOP-MC79IJF9:0 LISTENING
TCP 0.0.0.0:49667 LAPTOP-MC79IJF9:0 LISTENING
TCP 0.0.0.0:49668 LAPTOP-MC79IJF9:0 LISTENING
TCP 0.0.0.0:49673 LAPTOP-MC79IJF9:0 LISTENING
TCP 127.0.0.1:27017 LAPTOP-MC79IJF9:0 LISTENING
TCP 192.168.42.172:139 LAPTOP-MC79IJF9:0 LISTENING
TCP [::]:135 LAPTOP-MC79IJF9:0 LISTENING
TCP [::]:445 LAPTOP-MC79IJF9:0 LISTENING
TCP [::]:4000 LAPTOP-MC79IJF9:0 LISTENING
TCP [::]:7680 LAPTOP-MC79IJF9:0 LISTENING
TCP [::]:49664 LAPTOP-MC79IJF9:0 LISTENING
TCP [::]:49665 LAPTOP-MC79IJF9:0 LISTENING
TCP [::]:49666 LAPTOP-MC79IJF9:0 LISTENING
TCP [::]:49667 LAPTOP-MC79IJF9:0 LISTENING
TCP [::]:49668 LAPTOP-MC79IJF9:0 LISTENING
TCP [::]:49673 LAPTOP-MC79IJF9:0 LISTENING
TCP [::1]:49669 LAPTOP-MC79IJF9:0 LISTENING
TCP [240b:c020:4d0:32ae:1106:be43:8832:7dcf]:50412 tp-in-f188:5228 ESTABLISHED
TCP [240b:c020:4d0:32ae:1106:be43:8832:7dcf]:51820 196:https CLOSE_WAIT
TCP [240b:c020:4d0:32ae:1106:be43:8832:7dcf]:54850 [64:ff9b::14c7:7855]:https ESTABLISHED
TCP [240b:c020:4d0:32ae:1106:be43:8832:7dcf]:58107 [64:ff9b::68f4:2ac1]:https ESTABLISHED
TCP [240b:c020:4d0:32ae:1106:be43:8832:7dcf]:58440 us:https CLOSE_WAIT
TCP [240b:c020:4d0:32ae:1106:be43:8832:7dcf]:62041 lb-006:https ESTABLISHED
TCP [240b:c020:4d0:32ae:1106:be43:8832:7dcf]:62847 tp-in-f188:5228 ESTABLISHED
(・・・略・・・)
UDP 0.0.0.0:1900 *:*
UDP 0.0.0.0:5050 *:*
UDP 0.0.0.0:5353 *:*
UDP 0.0.0.0:5353 *:*
UDP 0.0.0.0:5353 *:*
UDP 0.0.0.0:5353 *:*
UDP 0.0.0.0:5353 *:*
UDP 0.0.0.0:5355 *:*
UDP 0.0.0.0:6771 *:*
UDP 0.0.0.0:6771 *:*
UDP 0.0.0.0:25372 *:*
UDP 0.0.0.0:50001 *:*
UDP 0.0.0.0:59865 *:*
(・・・略・・・)

netstatのオプション

netstatコマンドのオプションを一覧にまとめます。

オプション内容
-a待ち受けしているポートを含むポートの状態を表示する。
-eイーサネットの統計情報を表示する。
-nコンピュータ名やプロトコルを使わず、IPアドレスとポート番号で表示する。
-rルーティングテーブルを表示する。
-p プロトコル名ソケットが属すプログラムのPIDとプロセス名を表示する。
-b通信するポートを作成したプロセスの実行ファイルを表示する。
(管理者権限が必要)

自分の端末でWebサーバやFTPサーバを立ち上げた時に、きちんとLISTENING(待ち受け状態)になっているかどうか確認するときに使えるコマンドかと思います。

LAN内の他の端末からアクセスする場合は、さらにファイアウォールの設定を確認する必要があります。

さらにさらにWANに公開する場合は、ルータやロードバランサーの設定、ネットワーク構成などいろいろと考える必要があります。

arpコマンド - IPアドレスとMACアドレスの情報を表示・管理

arpは、IPアドレスとMACアドレスの結びつきを管理するARPテーブルの表示や更新を行うコマンドです。

(arpは、IPアドレスからイーサネット環境で通信する際に必要なMACアドレスを調べるためのプロトコルです)

イーサネットに接続した機器が通信を開始するとき、データを渡す相手のMACアドレスを知るためにネットワーク上のすべての機器に対して問い合わせを行い、該当する機器がMACアドレスを応答します。

このとき、応答のあったIPアドレスとMACアドレスの対応を一時的に保存するのがARPテーブルになります。

ARPテーブル表示

ARPテーブルを表示するには、下記コマンドを実行します。

[コンソール]

1
arp -a

実行例は以下の通りです。

[実行結果(例)]

1
2
3
4
5
6
7
8
9
10
インターフェイス: 192.168.42.172 --- 0xd
インターネット アドレス 物理アドレス 種類
192.168.42.129 0a-e9-6c-3f-e5-0d 動的
192.168.42.255 ff-ff-ff-ff-ff-ff 静的
224.0.0.22 01-00-5e-00-00-26 静的
224.0.0.251 01-00-5e-00-00-eb 静的
224.0.0.252 01-00-5e-00-00-ac 静的
239.255.102.18 01-00-5e-7f-66-e2 静的
239.255.255.250 01-00-5e-7f-ff-0a 静的
255.255.255.255 ff-ff-ff-ff-ff-ff 静的

IPアドレスが「インターネット アドレス」、MACアドレスが「物理アドレス」と表示されます。

ARPテーブル更新

ネットワーク上の機器を入れ替えた直後は、ARPテーブルに古い機器のMACアドレスが記録されたままとなっています。

ARPテーブルの内容をいったんクリアしたい場合は、下記コマンドを実行します。

[コンソール]

1
arp -d

このコマンドは管理者権限のあるコンソールで実行する必要がありますのでご注意ください。

新しく接続した機器に接続できない場合は、おまじないとしてこのコマンドを実行するようにするといいかもしれません😀

Google Apps Script - ⑨GMailの操作(メール削除)

Gmailを長く使っていると、メールマガジンや広告メールなど削除対象でしかないメールがたくさん溜まっていきます。

今回はGASを使って、不要なメールを削除してみます。

メールの削除

メールを削除するにはmoveToTrash関数(7行目)を使います。

削除対象のメールはsearch関数(3行目)を使って検索を行い、検索対象となったメールだけを削除します。

[Google Apps Script]

1
2
3
4
5
6
7
8
9
// メイン関数
function main() {
var deleteThreads = GmailApp.search("検索ワード");

//検索条件に合致するメールをゴミ箱に移動
for (var i = 0; i < deleteThreads.length; i++) {
deleteThreads[i].moveToTrash();
}
}

トリガー機能を使って、このスクリプトを定期的に実行するようにすれば、いちいち手動でメールを削除することなく受信メールボックスがすっきりしますのでおススメです😊

Google Apps Script - ⑨GMailの操作(受信ボックスの検索)

GASを使って、Gmailの検索を行います。

受信ボックスの検索

受信ボックスの検索にはGmailApp.search()関数を使います。

“検索ワード”が含まれるメールのの送信元、送信先、日付、件名、本文を表示するスクリプトは次のようになります。

[Google Apps Script]

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
function main() {
var thds = GmailApp.search("検索ワード");
for (var i = 0; i < thds.length; i++) {
var thd = thds[i];
var msgs = thd.getMessages();
for (var j = 0; j < msgs.length; j++) {
var msg = msgs[j];
var from = msg.getFrom(); // 送信元
var to = msg.getTo(); // 送信先
var date = msg.getDate(); // 日付
var subject = msg.getSubject(); // 件名
var body = msg.getBody(); // 本文
Logger.log(from + " : " + to + " : " + date+ " : " + subject);
}
}

検索クエリー

検索に使用可能なクエリーは下記の通りです。

検索内容検索演算子
送信者で検索from:from: 太郎
受信者で検索to:to: 次郎
件名で検索subject:subject: 〇〇につきまして

上記以外の検索オプションは下記をご参照ください。

Gmail で使用できる検索演算子 - https://support.google.com/mail/answer/7190?hl=ja