Semalt: استخراج بيانات الويب باستخدام Google Chrome Plugin

إذا كنت تستخدم متصفح Google Chrome لتصفح الإنترنت ، فهناك مكون إضافي للمتصفح لاستخراج البيانات من صفحات الويب المفضلة لديك. Google Chrome Scraper هو برنامج يستخدم لاسترداد البيانات من كل من مواقع الويب الديناميكية والثابتة. سيتيح لك مكون Chrome الإضافي هذا مسح محتوى صفحة الويب المفضلة لديك وحفظه في محرر مستندات Google.
مكشطة الويب جوجل كروم
Google Chrome Web Scraper هو امتداد متصفح يستخرج البيانات من المواقع والصفحات. مع هذا التمديد ، لا تحتاج إلى مئات العمال لنسخ ولصق المحتوى من المواقع طوال اليوم. بعد التثبيت على متصفح Chrome ، كل ما عليك فعله هو تحديد المحتوى الهدف والسماح لمكشطة الويب بالباقي.
إذا لم تكن لديك معرفة بالتشفير ، فهذه هي أفضل كاشطة ويب للنظر فيها. يوصى باستخدام Google Chrome Scraper لكل من الكشط الصغير والكبير. يتألف من معلومات وبيانات قيمة يمكن تحويلها إلى بيانات استخباراتية تنافسية. مع هذا الامتداد ، يمكن بسهولة استخراج جميع الصور والأدلة المستهدفة الخاصة بك وتصديرها إلى CouchDB أو جداول البيانات.
أدلة حول كيفية البدء
يعد مسح صفحات الويب باستخدام المكوّن الإضافي للمتصفح مهمة افعلها بنفسك ويمكنك تنفيذها بسرعة باستخدام جهاز الكمبيوتر. إليك دليل نهائي سيساعدك على البدء:

- ابدأ تشغيل متصفح Google Chrome وانقر على "سوق Chrome الإلكتروني".
- افتح ملحقات المستعرض الخاص بك وابحث عن "Scraper".
- انقر على خيار "إضافة إلى Chrome" المعروض على شاشتك
- افتح موقع الويب أو صفحة الويب المراد كشطه وقم بتمييز البيانات التي تريد الحصول عليها. انقر بزر الماوس الأيمن على العنصر وانقر على "Scrape مماثلة".
- ستظهر وحدة كاشطة على الشاشة. لاحظ أن وحدة تحكم مكشطة الويب تتكون من البيانات المستخرجة.
- في هذه المرحلة ، يمكنك تحديد مكان حفظ المحتوى المسروق الخاص بك. على سبيل المثال ، يمكنك حفظ المحتوى في محرر مستندات Google بالنقر فوق "حفظ في محرر مستندات Google".
لاحظ أن "الكاشطة" هي نص برمجي آلي يستخرج البيانات المفيدة من صفحات الويب والمواقع الديناميكية. بخلاف أدوات تجريف الويب الأخرى ، يمكن لـ Google chrome scraper أيضًا أن تتخلص من البيانات التي تم إنشاؤها باستخدام JavaScript. تتضمن المهام الأخرى التي ينفذها المكون الإضافي لمكشطة Chrome ما يلي:
- النقر على أزرار المحتوى لتحميل البيانات ؛
- النقر على أزرار ترقيم الصفحات التي تقوم بتحميل المعلومات باستخدام AJAX ؛
- التمرير لأسفل صفحات الويب لتحميل المزيد من المحتوى ؛
- في انتظار تحميل المحتوى الديناميكي في صفحة الويب ؛
بعد تجريف البيانات من صفحة ويب ، يمكنك تنزيل البيانات بتنسيق قيم مفصولة بفواصل (CSV) أو تخزينها في CouchDB. باستخدام Google Chrome Web Scraper ، لا يتعين عليك العمل على استخراج البيانات أو بناء الخطة أو التصدير.