انظم الى قناتنا على التليجرام الان       انظم الان!
المشاركات

Web Scraping




الحصول على البيانات من الويب باستخدام بايثون : دليل شامل مع أمثلة كاملة


في عصر المعلومات الحديث، يُعتبر الوصول إلى البيانات عبر الإنترنت أمرًا ضروريًا للعديد من الأغراض، سواء كنت تعمل في مجال الأعمال التجارية، البحث الأكاديمي، أو مجرد الفضول العام. تقدم تقنية الويب سكرابنج (Web Scraping) طريقة فعالة لجمع البيانات من الويب بشكل آلي، وفي هذا المقال، سنستعرض كيفية القيام بذلك باستخدام لغة البرمجة بايثون.


ما هو الويب سكرابنج؟


الويب سكرابنج هو عملية استخراج البيانات من صفحات الويب وتحويلها إلى تنسيق يمكن استخدامه بواسطة البرمجيات. يتيح لك الويب سكرابنج جمع البيانات من الويب بشكل تلقائي وتنظيمها واستخدامها وفقًا لاحتياجاتك الخاصة.


البداية في الويب سكرابنج باستخدام بايثون


قبل البدء في الويب سكرابنج بواسطة بايثون، يجب عليك تثبيت بعض المكتبات الضرورية. يمكنك فعل ذلك باستخدام أداة إدارة الحزم . فمثلا، لتثبيت مكتبة `requests` التي تستخدم لجلب محتوى الصفحات، يمكنك استخدام الأمر :التالي في سطر الأوامر


pip install requests


ثم بعد ذلك، قم بتثبيت مكتبة `BeautifulSoup` التي تستخدم لتحليل محتوى HTML:


pip install beautifulsoup4


الآن، بمجرد أن تكون قد قمت بتثبيت هذه المكتبات، يمكنك بدء كتابة الشفرة لجلب البيانات.


مثال عملي


لنفترض أننا نرغب في جلب بعض ال quotes العشوائية بشكل مستمر :


import requests
from bs4 import BeautifulSoup
import random

def generate_quote():
    url = 'http://quotes.toscrape.com'
    response = requests.get(url)
    soup = BeautifulSoup(response.text, 'html.parser')
    quotes = soup.find_all('span', class_='text')
    random_quote = random.choice(quotes).text.strip()
    return random_quote

print(generate_quote())


في هذا المثال أستخدمنا requests لأرسال الطلبات ثم أستخدمنا BeautifulSoup لتحليل محتوي ال html


الاستنتاج


توفر Python ومكتباته القوية مثل `requests` و `BeautifulSoup` وسيلة سهلة وفعالة لجلب البيانات من الويب. باستخدام هذه الأدوات، يمكنك تنفيذ عمليات الويب سكرابنج بكفاءة واستخدام البيانات المستخرجة في مشاريعك الشخصية أو التجارية.


آمل أن يكون هذا المقال مفيدًا لك في البدء في عالم الويب سكرابنج باستخدام Python!

إرسال تعليق

موافقة ملفات تعريف الارتباط
نحن نقدم ملفات تعريف الارتباط على هذا الموقع لتحليل حركة المرور وتذكر تفضيلاتك وتحسين تجربتك.
Oops!
يبدو أن هناك خطأ ما في اتصالك بالإنترنت. يرجى الاتصال بالإنترنت وبدء التصفح مرة أخرى.
تم اكتشاف حظر الاعلانات!
لقد اكتشفنا أنك تستخدم مكونًا إضافيًا لحظر الإعلانات في متصفحك.
تُستخدم الإيرادات التي نكسبها من خلال الإعلانات لإدارة موقع الويب هذا، ونطلب منك إدراج موقعنا على الويب في القائمة البيضاء في مكون حظر الإعلانات الخاص بك.
Site is Blocked
Sorry! This site is not available in your country.