أتش تي أم أل بسيط استضافة دوم دروبال

بسيطة HTML DOM محلل هو واحد من أفضل الأشياء التي حدثت لي. أتذكر تلك الأيام عندما كنت استخدام التعابير العادية وظيفة preg_match_all لجلب القيم من النص المقتبس، أنها لم تكن على ما يرام. ولكن منذ ذلك الحين وجدت هذه HTML DOM محلل، كانت الحياة طريقة سهلة جدا عندما يتعلق الأمر جلب البيانات واستخراج القيم من صفحات HTML.

خلال أيامي الأولى أثناء استخدام هذا البرنامج النصي، وكنت مرتبكة جدا في الكثير من الأحيان. محلل هو في الواقع رهيبة بحيث يوفر الكثير من الميزات وأنها يمكن أن تفعل كل شيء تقريبا كنت تريد محلل للقيام به. المشكلة الوحيدة هي أن نتذكر بناء الجملة وطريقة الدعوة وظائف مختلفة جنبا إلى جنب مع العديد من المعلمات منفصلة لكل منهم.

استضافة

لقد قدمت قائمة من الرموز، التي يمكنني استخدامها من وقت لآخر، التي يمكن أن تأتي في متناول اليدين للكم جميعا. قراءة المزيد لفهم استخدام بسيطة HTML DOM محلل والحصول على رموز PHP الجاهزة لنفسه.

تحميل وتخزين البيانات المهيكلة

ويمكن الحصول على البيانات من أساسا ثلاثة مصادر مختلفة. URL، ملف ثابت أو سلسلة HTML. استخدام التعليمات البرمجية التالية لإنشاء DOM من ثلاثة بدائل مختلفة.

العثور على عناصر HTML على أساس أسماء العلامات الخاصة

افترض أنك تريد أن تجد كل صورة على صفحة ويب أو القول، كل وصلة. سنكون باستخدام وظيفة "العثور على" لاستخراج هذه المعلومات من وجوه. وفيما يلي كيفية القيام بذلك باستخدام بسيط DOM HTML محلل:

استخراج قيم سمات من العناصر

افترض أنك ترغب في الحصول على أسماء جميع حقول الإدخال على صفحة ويب، دعنا نقول لمثل nimishprabhu.com/chrome-extension-hello-world-example.html. الآن إذا كنت ترى صفحة ويب ستلاحظ أن هناك شكل تعليق على الصفحة التي لديها حقول الإدخال. يرجى ملاحظة أن مربع تعليق هو عنصر ناحية النص وليس عنصر المدخلات، لذلك لن يتم الكشف عن ذلك. ولكن للكشف عن بقية مرئية المجالات فضلا أخفى يمكنك استخدام التعليمات البرمجية التالية:

عناصر الترشيح على أساس قيم خصائصها

عندما تصاميم مطور صفحة، وقال انه يستخدم سمات مختلفة لتحديد فريد وتصنيف المعلومات على صفحة ويب. محلل ليس البشر، وبالتالي لا يمكن تصور الفرق، ولكن يمكن اكتشاف هذه الصفات وتصفية الانتاج وذلك للحصول على مجموعة دقيقة من البيانات. دعونا نأخذ مثالا عمليا لفهم أفضل. إذا كنت ترى هذه الصفحة. https://www.phpbb.com/community/viewtopic.php؟f=46t=543171 يمكنك مشاهدة الصفحة ينقسم إلى رأس والمحتوى وتذييل الصفحة. حتى الآن كان المحتوى هو مزيد فرعية مقسمة إلى وظيفة. هذه الصفحة تحتوي على 1 فقط آخر لكنني قررت اختيار هذا لأنه يحتوي على الكثير من الارتباطات التشعبية. الآن لنفترض أنك تريد استخراج فقط الارتباطات التشعبية في آخر وليس الصفحة بأكملها. وينبغي أن يكون النهج على النحو التالي:

بسيط أتش تي أم أل دوم دروبال استضافة فقط الروابط

التحقق من مصدر من صفحة ويب. معرفة ما إذا كان الارتباطات التشعبية تتبع نوعا من نمط. إذا كنت تبحث عن كثب وسوف تجد أن كل منهم الطبقة = "postlink". وهذا سيجعل استخراج لهم، وقطعة من الكعكة. قراءة رمز أدناه لمعرفة كيفية تصفية عناصر HTML على أساس القيم من الصفات.

هناك شيء الجدير بالذكر هنا، يمكنك استخدام "." والبادئات "#" لتصفية class و id سمات التوالي. لذلك رمز أعلاه ستعمل دون أي تغيير في حالة استخدام مرشح على النحو التالي:

نمط مطابقة حين تصفية سمات العناصر

النظر في المثال أعلاه حيث أننا استخراج كل الروابط من هذا المنصب. يقول كنت تريد أن تجد فقط روابط للمنتديات الفرعية في المجتمع. إذا لاحظت كل منهم تبدأ www.phpbb.com/community/viewforum.php. لذلك دعونا تصفية الارتباطات التشعبية باستخدام "يبدأ مع" مرشح لجلب فقط الروابط بدءا www.phpbb.com/community/viewforum.php

وبالمثل، أقول إذا كنت تريد أن تجد جميع الروابط التي تحتوي على phpbb.com ثم يمكنك تصفية باستخدام "يحتوي على" مرشح على النحو التالي:

إذا كنت متأكدا من فقط الجزء نهاية قيمة سمة. دعونا نقول، على سبيل المثال، كنت الغاء صفحة ويب الذي يحتوي على عناصر ال div عديدة. هذه عناصر شعبة ديك معرف السمة شيء من هذا القبيل:

المحتوى هنا

المحتوى هنا

وما إلى ذلك وهلم جرا.
ثم يمكنك أن تجد هذه العناصر ال div باستخدام "ينتهي" مرشح على النحو التالي:

إضافة / تغيير سمات من العناصر

دعونا نقول لكم تريد تغيير قيمة سمة من عنصر معين. على سبيل المثال؛ إذا كنت ترغب في تغيير كافة الارتباطات التشعبية وجود الطبقة = postlink إلى الطبقة = topiclink، يمكنك القيام بذلك على النحو التالي:

العثور على العنصر الألف من بيانات تحليل

لاحظ أن ترقيم العناصر يبدأ من 0 وليس 1. وهكذا سيتم العثور على العنصر الأول في موقع 0TH. لنفترض أنك تريد استخراج الارتباط التشعبي الارتباط 3RD مع postlink الدرجة على صفحة ويب، يمكنك استخدام الطريقة التالية:

التلاعب في المحتوى الداخلي من الأكواد

إذا كنت ترغب في مسح محتويات الداخلية للشعبة مع معرف كمحتوى، يمكنك القيام بذلك على النحو التالي:

إذا كنت ترغب في إلحاق النص على المحتوى الموجود، يمكنك القيام بذلك على النحو التالي:

اتباعها من أجل إلحاقها النص على المحتوى الموجود، يمكنك استخدام التعليمات البرمجية التالية:

التفاف محتويات عنصر داخل عنصر جديد

نقول لكم فلكم شعبة القائمة مع محتوى الهوية، والآن قمت بعمل شعبة المجمع ويريدون أن أرفق شعبة المحتوى في شعبة المجمع. وإليك كيف تفعل ذلك:

التعامل مع القضايا تسرب الذاكرة أثناء استخدام PHP بسيطة HTML DOM محلل

وأخيرا وبالتأكيد ليس آخرا، التعامل مع مشكلة تسرب الذاكرة. بمجرد البدء في استخدام هذا البرنامج النصي على نطاق واسع سوف تواجه أخطاء الذاكرة استنفدت وسوف تبقى يتساءل ما هو الخطأ في السيناريو الخاص بك. قد يكون راجعا إلى عدم التعامل مع مشكلة تسرب الذاكرة هذه المشكلة. لن أتحدث بالتفصيل عن ما هو تسرب الذاكرة أو كيف تحدث هذه المشكلة ولكن يمكنك أن تقرأ قليلا جدا عن هنا. لمعالجة هذه المسألة لا ننسى لمسح متغير $ أتش تي أم أل خلق وضبطه مرة واحدة أنه ليس مطلوبا بالإضافة إلى ذلك.

يمكنك أيضا استخدام وظيفة بارد التي أنشأتها فلاش الرعد من StackOverFlow.com، التحقق من ذلك هنا جنبا إلى جنب مع المثال استخدامه.

أعتقد أن هذه الأمثلة كافية بما فيه الكفاية بالنسبة لك لتبدأ باستخدام PHP بسيطة HTML DOM محلل. إذا كان لديك أي شكوك أو استفسارات استخدام نموذج التعليق أدناه. وأود أن أضيف المزيد من الأمثلة وفقا لطلبات والاستفسارات. آمل هذه المادة تساعدك تتخلص من البيانات بشكل فعال.

وكان هذا الدخول في PHP.

4 الأفكار حول “ أفضل 10 أفضل الأمثلة على استخدام PHP بسيطة HTML DOM محلل ”

مرحبا. يرجى مراجعة أتش تي أم أل

100 الرصاص (الناضجة القراء) رقم 100 بالقرب من النعناع [46373] MAXIMUM_ORDER_TEXT
$ 4.99

من هذا، أريد أن التخلي عن لقب الوحيد أي بمعنى "100 الرصاص (الناضجة القراء) رقم 100 بالقرب النعناع"
ولكن أنا على الحصول على حد سواء. هنا هو س / ع
[PRODUCT_TITLE] => صفيف
(
[0] => 100 الرصاص (الناضجة القراء) رقم 30 بالقرب من النعناع
[10]
MAXIMUM_ORDER_TEXT
[1] => $ 1.99
[2] => 100 الرصاص (الناضجة القراء) رقم 100 بالقرب من النعناع
[46373]
MAXIMUM_ORDER_TEXT
[3] => $ 4.99
[4] => 100 الرصاص (الناضجة القراء) رقم 32 بالقرب من النعناع
[12]
MAXIMUM_ORDER_TEXT
[5] => $ 1.99
[6] => 100 الرصاص (الناضجة القراء) رقم 34 بالقرب من النعناع
[14]
MAXIMUM_ORDER_TEXT
[7] => $ 1.99
[8] => 100th الذكرى الأوصياء الخاص للمجرة (2014 طلقة واحدة) رقم 1 (المتغير) بالقرب من النعناع

واسمحوا لي أن أعرف ما يجب القيام به.

مراقبة نمط وفقا لتقسيم السلاسل التي تم الحصول عليها.

عنوان $ = تنفجر ( '['، $ PRODUCT_TITLE)؛
أو
عنوان $ = تنفجر ( 'النعناع القريب "، $ PRODUCT_TITLE)؛

ثم استخدم $ لقب [0] للحصول على الناتج النهائي.

ثق أن يساعد هذا.

شكر مع تحياتي

شاهد هذا الفيديو!

مقالات ذات صلة

Geolitecity استضافة دات دروبالأحاول أن أضيف جيو IP لايم الموقع يعمل على. لقد استخدمت السياق الجغرافية وحدات IP وجيو IP، وأنا قادرة على خلق سياق بناء على البلاد. ومع ذلك أنا بحاجة لعرض المحتوى على أساس ...
لماذا استخدام وورد على استضافة دروبالأرسلت بواسطة توم إيور على 6 أغسطس 2015 إذا كنت في النقطة التي ترغب في بدء بلوق، سواء كان ذلك لأسباب مهنية أو شخصية، والخيار الأفضل لك هو موقع على شبكة الانترنت الذاتي استضافت ...
نيراف مهتا دروبال استضافةأسبوعين إلى الوراء، وكان في أكثر من موقع ئي باي عندما يكون أحد مديري المنتجات ونحن نعمل مع سجلتها "سأكون حزينا حقا إذا 3 سنوات من الآن، كنت لا تزال عالقة في دروبال". كشركة، ونحن لدينا ...
معرض بسيط استضافة حدة دروبالويقدم هذا النموذج عبارة عن دمج بين Juicebox HTML5 مكتبة معرض استجابة شعبية ودروبال. Juicebox هي من نواح عديدة خليفة SIMPLEVIEWER ويقدم قوية ...
استضافة دروبال مع خدمة تصميم المواقعHTTPS هو بروتوكول يقوم بتشفير طلبات HTTP وردودهم. هذا يضمن أنه إذا ما كان هناك شخص قادر على حل وسط الشبكة بين الكمبيوتر وخادم كنت تطلب ...