【Python】Excelの重複データを削除:openpyxlの基本テクニック

Python_Excel重複データ削除_アイキャッチ Python

Python(openpyxl)で、エクセルの重複データを削除する方法をご紹介します。

ぜひ、お試しください。

Excelの重複データを削除

以下のコードを実行すると、ダブリをチェックして該当行を削除します。


import openpyxl

wb = openpyxl.load_workbook('C:/Users/xxx/Desktop/test/test.xlsx')
ws = wb['Sheet1']

#配列宣言
Chiiki = []

#先頭行からループ
for Q in range(ws.max_row + 1):
    if Q == 0:
        continue

    #セル値を変数へ格納
    list = ws.cell(Q, 1).value

    #セル値の行番号を取得
    list_Num = Q

    #最終行から逆ループ
    for i in reversed(range(ws.max_row + 1)):
        if i == 0:
            break

        #セル値とlistが一緒だったら
        if ws.cell(i, 1).value == list:

            #同じ行同士の比較はしない
            if i == Q:
                continue
            else:
                #行削除
                ws.delete_rows(i)

#別名で保存
wb.save('C:/Users/xxx/Desktop/test/test重複削除.xlsx')

 

コード実行後

エクセルシート内のデータをチェックして、重複のみ削除します。

下図は結果がわかりやすいように、コード実行前に以下の手作業をしています。
・削除するデータは、背景色を黄色に着色
・削除しないデータは、B列に「残す」と入力


 
 
この記事がお役に立ちますと幸いです。
 

【Python】Excelの重複データに色付け:openpyxlの基本テクニック
...

 

「PythonでExcel、メール、Webを自動化する本」

準備に時間をかけず、すぐ始められます
実践的な例題で、実務で本当に使えるプログラムを紹介
自分の仕事を効率化したい方の大きな武器になるオススメの1冊です!