Python(openpyxl)で、エクセルの重複データを削除する方法をご紹介します。
ぜひ、お試しください。
Excelの重複データを削除
以下のコードを実行すると、ダブリをチェックして該当行を削除します。
import openpyxl
wb = openpyxl.load_workbook('C:/Users/xxx/Desktop/test/test.xlsx')
ws = wb['Sheet1']
#配列宣言
Chiiki = []
#先頭行からループ
for Q in range(ws.max_row + 1):
if Q == 0:
continue
#セル値を変数へ格納
list = ws.cell(Q, 1).value
#セル値の行番号を取得
list_Num = Q
#最終行から逆ループ
for i in reversed(range(ws.max_row + 1)):
if i == 0:
break
#セル値とlistが一緒だったら
if ws.cell(i, 1).value == list:
#同じ行同士の比較はしない
if i == Q:
continue
else:
#行削除
ws.delete_rows(i)
#別名で保存
wb.save('C:/Users/xxx/Desktop/test/test重複削除.xlsx')
コード実行後
エクセルシート内のデータをチェックして、重複のみ削除します。
下図は結果がわかりやすいように、コード実行前に以下の手作業をしています。
・削除するデータは、背景色を黄色に着色
・削除しないデータは、B列に「残す」と入力
この記事がお役に立ちますと幸いです。
・【Python】エクセルを自動処理する方法まとめ
【Python】エクセル処理を自動化:超便利55選
...
「PythonでExcel、メール、Webを自動化する本」
準備に時間をかけず、すぐ始められます
実践的な例題で、実務で本当に使えるプログラムを紹介
自分の仕事を効率化したい方の大きな武器になるオススメの1冊です!
リンク