Python(openpyxl)で、エクセルの重複データを削除する方法をご紹介します。
重複を削除したリストを作成することができます。
ぜひ、お試しください。
Excelの重複データを削除
以下のコードを実行すると、ダブリをチェックして該当行を削除します。
import openpyxl
wb = openpyxl.load_workbook('C:/Users/xxx/Desktop/test/test.xlsx')
ws = wb['Sheet1']
#配列宣言
Chiiki = []
#先頭行からループ
for Q in range(ws.max_row + 1):
if Q == 0:
continue
#セル値を変数へ格納
list = ws.cell(Q, 1).value
#セル値の行番号を取得
list_Num = Q
#最終行から逆ループ
for i in reversed(range(ws.max_row + 1)):
if i == 0:
break
#セル値とlistが一緒だったら
if ws.cell(i, 1).value == list:
#同じ行同士の比較はしない
if i == Q:
continue
else:
#行削除
ws.delete_rows(i)
#別名で保存
wb.save('C:/Users/xxx/Desktop/test/test重複削除.xlsx')
コード実行後
エクセルシート内のデータをチェックして、重複のみ削除します。
下図は結果がわかりやすいように、コード実行前に以下の手作業をしています。
・黄色は重複しているので削除するデータ
・B列で「残す」は、削除しないデータ
この記事がお役に立ちますと幸いです。

【Python】Excelの重複データに色付け:openpyxlの基本テクニック
...