excel and python

كيف يمكنني قراءة ملف Excel باستخدام Python؟

تعتبر Python واحدة من أشهر لغات البرمجة بفضل تنوع مكتباتها وقدرتها على التعامل مع بيانات ضخمة، بما في ذلك ملفات Excel. سنستعرض في هذا المقال كيفية قراءة ملفات Excel باستخدام مكتبات Python، مع شرحٍ مفصل للأكواد والمكتبات المستخدمة، وأفضل الممارسات في هذا السياق.

excel and python

محتويات المقال

  1. مقدمة حول أهمية Python في قراءة ملفات Excel
  2. الأدوات والمكتبات الأساسية المستخدمة
  3. مكتبة pandas وطرق استخدامها لقراءة ملفات Excel
  4. كيفية قراءة أوراق عمل متعددة من ملف Excel
  5. قراءة أجزاء محددة من البيانات
  6. طرق معالجة وتنظيم البيانات المستوردة
  7. الأسئلة الشائعة

1. مقدمة حول أهمية Python في قراءة ملفات Excel

تُعد Python خيارًا ممتازًا للتعامل مع ملفات Excel بفضل مكتباتها المتعددة التي توفر طرقًا سهلة وفعّالة لتحليل البيانات. ومن بين هذه المكتبات، نجد مكتبة pandas وopenpyxl التي تسهّل على المبرمجين استيراد ومعالجة بيانات ملفات Excel بصيغ مختلفة مثل .xlsx و.xls.


2. الأدوات والمكتبات الأساسية المستخدمة

يمكن قراءة ملفات Excel بطرق عديدة في Python، وأهم المكتبات التي تدعم هذا الغرض هي:

الأدوات والمكتبات الأساسية المستخدمة

نصيحة: يُفضل استخدام مكتبة pandas لسهولة استخدامها ودعمها لأنواع الملفات الحديثة.


3. مكتبة pandas وطرق استخدامها لقراءة ملفات Excel

مكتبة pandas هي واحدة من أقوى المكتبات لتحليل البيانات في Python، وتتيح للمبرمجين قراءة ملفات Excel بكفاءة عالية. لقراءة ملف Excel باستخدام pandas، نستخدم دالة read_excel كما يلي:

مثال: قراءة ملف Excel بالكامل

import pandas as pd

# قراءة الملف بالكامل
df = pd.read_excel("sample_data.xlsx")
print(df.head())  # طباعة أول 5 صفوف من البيانات
Python

ملاحظة: يتم تحميل البيانات كـ DataFrame، وهي بنية بيانات توفرها مكتبة pandas لتسهيل التعامل مع البيانات وجدولتها.

تفسير الكود:

  • import pandas as pd: استيراد مكتبة pandas وتحديد اختصار pd لها.
  • df = pd.read_excel("sample_data.xlsx"): استخدام دالة read_excel لتحميل الملف كـ DataFrame وتخزينه في متغير df.
  • print(df.head()): طباعة أول خمسة صفوف من البيانات للتحقق من محتويات الملف.

4. كيفية قراءة أوراق عمل متعددة من ملف Excel

تحتوي بعض ملفات Excel على عدة أوراق عمل. باستخدام مكتبة pandas، يمكننا قراءة ورقة معينة أو جميع الأوراق في نفس الوقت.

مثال: قراءة ورقة معينة من ملف Excel

# قراءة ورقة معينة من الملف
df_sheet1 = pd.read_excel("sample_data.xlsx", sheet_name="Sheet1")
print(df_sheet1.head())
Python

مثال: قراءة جميع الأوراق من ملف Excel

# قراءة جميع الأوراق في نفس الوقت
all_sheets = pd.read_excel("sample_data.xlsx", sheet_name=None)

# عرض الأوراق
for sheet_name, data in all_sheets.items():
    print(f"Sheet: {sheet_name}")
    print(data.head())
Python

ملاحظة: عند استخدام sheet_name=None، تقوم pandas بتحميل جميع الأوراق كقاموس Dictionary يحتوي على أسماء الأوراق كالمفاتيح وبياناتها كالقيم.


5. قراءة أجزاء محددة من البيانات

في بعض الأحيان، قد تحتاج إلى قراءة جزء محدد من البيانات دون الحاجة لتحميل الملف بالكامل. يمكن تحقيق ذلك باستخدام بعض المعاملات في دالة read_excel.

تحديد الأعمدة أو الصفوف المطلوبة

تحديد الأعمدة أو الصفوف المطلوبة

مثال: قراءة أعمدة وصفوف محددة

# قراءة عمودين فقط
df_limited = pd.read_excel("sample_data.xlsx", usecols="A:C", nrows=10)
print(df_limited)
Python

شرح الكود:

  • usecols="A:C": تحديد قراءة الأعمدة من A إلى C فقط.
  • nrows=10: تحديد قراءة أول عشرة صفوف فقط.

تلميح: هذه المعاملات مفيدة لقراءة الملفات الكبيرة التي قد تستهلك وقتًا طويلاً للتحميل.


6. طرق معالجة وتنظيم البيانات المستوردة

بمجرد قراءة البيانات من ملف Excel، يمكننا إجراء العديد من العمليات باستخدام pandas لمعالجتها وتنظيمها بالشكل المطلوب، مثل:

  • تنظيف البيانات: للتعامل مع القيم الفارغة وإزالة الصفوف غير الضرورية.
  • التصفية: لاختيار صفوف معينة بناءً على شروط محددة.
  • تحويل البيانات: لتغيير الصيغ أو تعديل القيم لتناسب التحليلات المطلوبة.

مثال على تنظيف البيانات

# إزالة الصفوف التي تحتوي على قيم فارغة
df_cleaned = df.dropna()
print(df_cleaned)
Python

التصفية بناءً على شرط معين

# تصفية البيانات للحصول على الصفوف التي تتجاوز قيمة معينة
df_filtered = df[df['Column1'] > 100]
print(df_filtered)
Python

جداول توضيحية للعمليات الشائعة

جداول توضيحية للعمليات الشائعة

حفظ البيانات بعد المعالجة إلى ملف Excel

بعد الانتهاء من معالجة البيانات، قد نحتاج إلى حفظ النتائج إلى ملف Excel جديد. يمكن استخدام pandas لإنشاء ملف Excel وحفظه باستخدام دالة to_excel.

مثال: حفظ البيانات إلى ملف Excel جديد

# حفظ البيانات إلى ملف جديد
final_data.to_excel("processed_data.xlsx", index=False)
Python

حفظ أوراق متعددة إلى ملف Excel

في بعض الأحيان قد نرغب في حفظ البيانات إلى عدة أوراق عمل في نفس الملف. يمكننا تحقيق ذلك باستخدام ExcelWriter.

# حفظ أوراق متعددة إلى ملف Excel واحد
with pd.ExcelWriter("multi_sheet_data.xlsx") as writer:
    final_data.to_excel(writer, sheet_name="Summary")
    pivot_table.to_excel(writer, sheet_name="Pivot Table")
Python

نصيحة: استخدام ExcelWriter يتيح لك كتابة عدة DataFrames إلى أوراق متعددة في ملف واحد.


الأسئلة الشائعة

  1. ما هي أفضل مكتبة لقراءة ملفات Excel في Python؟
    • يُفضل استخدام مكتبة pandas، نظرًا لسهولة استخدامها ودعمها لأنواع ملفات Excel الحديثة.
  2. هل يمكن قراءة أوراق متعددة من ملف Excel؟
    • نعم، يمكن باستخدام مكتبة pandas وتحديد المعامل sheet_name لقراءة أوراق متعددة.
  3. هل يمكن تخصيص الأعمدة أو الصفوف التي يتم قراءتها؟
    • بالتأكيد، يمكنك استخدام المعاملات usecols وnrows لتحديد الأعمدة والصفوف المطلوبة.

خلاصة المقال

يمكن لبايثون تبسيط عملية قراءة وتحليل ملفات Excel باستخدام مكتبات قوية مثل pandas وopenpyxl. تعلمنا كيفية تحميل البيانات، معالجة ملفات Excel كبيرة الحجم بكفاءة، التعامل مع التنسيقات المعقدة، تحليل البيانات، وحفظ النتائج النهائية إلى ملفات Excel جديدة. باتباع أفضل الممارسات وإجراء التحسينات في الكود، يمكنك استخدام Python بشكل فعال لإدارة وتحليل البيانات بشكل احترافي.

اترك ردّاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *