المنهجية مركز بيو للأبحاث
[ad_1] The American Trends Panel The American Trends Panel (ATP) ، التي أنشأها مركز بيو للأبحاث ، هي لجنة تمثيلية وطنية للبالغين الأمري...
معلومات الكاتب
[ad_1]
The American Trends Panel
The American Trends Panel (ATP) ، التي أنشأها مركز بيو للأبحاث ، هي لجنة تمثيلية وطنية للبالغين الأمريكيين الذين تم اختيارهم عشوائياً والذين تم توظيفهم من مسوحات الاتصال الهاتفي بالأرقام العشوائية والهاتف المحمول (RDD). يشارك المشاركون من خلال استبيانات الويب الشهرية ذاتية الإدارة. يتم تزويد الأعضاء الذين لا يمتلكون الوصول إلى الإنترنت بجهاز لوحي ووصلة إنترنت لاسلكية. تتم إدارة الفريق بواسطة GfK.
البيانات الواردة في هذا التقرير مأخوذة من موجة اللوحة التي أجريت في الفترة من 29 مايو إلى 11 يونيو 2018 ، من بين 4،594 مستجيبًا. إن هامش الخطأ في العينة بالنسبة للعينة الكاملة من 594 4 من المستجيبين هو زائد أو ناقص 2.4 نقطة مئوية.
تم تعيين أعضاء لجنة الاتجاهات الأمريكية من العديد من المسوحات الأرضية والوطنية للأجسام الأرضية والهواتف المحمولة التي أجريت باللغتين الإنجليزية والإسبانية. في نهاية كل استطلاع ، تمت دعوة المستجيبين للانضمام إلى الفريق. تم تعيين أول مجموعة من أعضاء اللجنة من استقصاء الاستقصاء السياسي والنماذج لعام 2014 ، الذي أجري في 23 يناير إلى 16 مارس 2014. من 10013 من البالغين الذين تمت مقابلتهم ، تمت دعوة 9809 مشاركًا للمشاركة في اللجنة ، وتمت الموافقة على مشاركة 5338 مشاركًا. تم تعيين المجموعة الثانية من أعضاء اللجنة من مسح مركز بيو للأبحاث لعام 2015 ، الذي أجري في الفترة من 27 أغسطس إلى 4 أكتوبر 2015. ومن بين الأشخاص البالغ عددهم 6،004 من الأشخاص الذين تمت مقابلتهم ، تمت دعوة الجميع للانضمام إلى اللجنة ، ووافق 2976 على المشاركة. تم تعيين المجموعة الثالثة من أعضاء اللجنة من مسح أجري في الفترة من 25 أبريل إلى 4 يونيو 2017. من بين 50101 بالغ تمت مقابلتهم في المسح أو الاختبار التجريبي ، تمت دعوة 3،905 مشاركين في اللجنة وتم قبول 16285 مشاركًا. [19659003] تم ترجيح بيانات ATP في عملية متعددة الخطوات تبدأ بوزن أساسي يشتمل على احتمال اختيار المسح الأصلي للمستجيبين وحقيقة أنه في عام 2014 تم فرز عينات من أعضاء اللجنة لدعوتهم إلى اللجنة. بعد ذلك ، تم إجراء تعديل على حقيقة أن الميل للانضمام إلى اللوحة وتبقى لوحة نشيطة متنوعة عبر مجموعات مختلفة في العينة. تستخدم الخطوة الأخيرة في الترجيح تقنية تكرارية تعمل على مواءمة العينة مع المقاييس السكانية على عدد من الأبعاد. النوع الاجتماعي ، والسن ، والتعليم ، والعرق ، والأصل من اصل اسباني ، ومعلمات المنطقة تأتي من استطلاع المجتمع الأمريكي لعام 2016 لمكتب الولايات المتحدة. تأتي المعلمة الكثافة السكانية على مستوى المقاطعة (عشري) من تعداد الولايات المتحدة السنوي لعام 2010. ﯾﺄﺗﻲ ﻣﻌﯾﺎر ﺧدﻣﺔ اﻟﮭﺎﺗﻔﯾﺔ ﻣن اﻟدراﺳﺔ اﻻﺳﺗﻘﺻﺎﺋﯾﺔ اﻟﺻﺣﯾﺔ اﻟوطﻧﯾﺔ ﻓﻲ ﯾوﻟﯾو / ﺗﻣوز - دﯾﺳﻣﺑر 2016 وﻣن اﻟﻣﺗوﻗﻊ أن ﯾﺑدأ ﻋﺎم 2017. مؤشر انتساب الحزب هو متوسط استطلاعات الهاتف العامة العامة الثلاثة الأخيرة لمركز بيو للأبحاث. يأتي معيار الوصول إلى الإنترنت من استبيان ATP لعام 2017 للتحديث. يتم التعامل مع المستجيبين الذين لم يتمكنوا من الوصول إلى الإنترنت من قبل على أنهم لا يمتلكون الوصول إلى الإنترنت لأغراض الترجيح. تأخذ أخطاء أخذ العينات والاختبارات الإحصائية ذات الأهمية في الاعتبار تأثير الترجيح. تُجرى المقابلات باللغتين الإنجليزية والإسبانية ، ولكن العينة من أصل لاتيني في ATP هي في الغالب من مواليد الولايات المتحدة ومن الناطقين باللغة الإنجليزية.
يوضح الجدول التالي أحجام العينات غير الموزونة والخطأ المنسوب إلى أخذ العينات المتوقع عند مستوى 95٪ الثقة للمجموعات المختلفة في المسح:
أحجام العينات وأخطاء أخذ العينات للمجموعات الفرعية الأخرى متاحة عند الطلب.
بالإضافة إلى خطأ أخذ العينات ، يجب على المرء أن يتحمل في الاعتبار أن صياغة الأسئلة والصعوبات العملية في إجراء الدراسات الاستقصائية يمكن أن تؤدي إلى خطأ أو انحياز إلى نتائج استطلاعات الرأي.
كان لموجة مايو 2018 نسبة استجابة بلغت 84٪ (4559 استجابات من بين 5،486 فردًا في الفريق). مع الأخذ في الحسبان معدل الاستجابة المجمَّع المرجَّح لاستطلاعات التوظيف (10.0٪) والاستنزاف من أعضاء الفريق الذين تمت إزالتهم بناءً على طلبهم أو بسبب عدم النشاط ، فإن معدل الاستجابة التراكمي للموجة هو 2.4٪.
تحليل فيديو YouTube [19659012] ما هي قنوات YouTube؟ ولماذا التركيز على قنوات المشتركين العالية؟
يشبه إلى حد كبير صفحات الملف الشخصي على وسائط التواصل الاجتماعي الأخرى ، تعمل قنوات YouTube كوجود رسمي للمالك على YouTube وصفحة رئيسية مخصصة للمحتوى الذي نشره مالك القناة. يمكن للمستخدمين المهتمين بمشاهدة محتوى من "منشئ محتوى" محدد (بمعنى آخر ، شخص أو شركة أو علامة تجارية متواجدة على YouTube) الاشتراك في قناتهم ومشاهدة التحديثات المنتظمة منهم تلقائيًا عند زيارتهم للموقع. [19659003[اختارالباحثوناختبارقنواتالمشتركينعاليةالمستوىبدلاًمناستخداممقاييسمثلإجماليمشاهداتالفيديوللقناةهذالأنمعدلاتالمشتركينهيمقياسأفضللشعبيةالقناةبشكلعاممنالمرجحأنتؤديالقنواتذاتمعدلاتالمشتركينالمرتفعةبشكلمنتظمإلىإنتاجمقاطعفيديوشائعةويتمعرضهابشكلٍكبير،مقارنةًبالقنواتذاتعددالمشاهداتالمرتفعالذييمكنأنيكوننتاجًالمقطعفيديوفيروسيواحدبدلاًمنالشعبيةالمستمرة
يعتمد التحليل في هذا التقرير على فحص "التنزه العشوائي" عبر مقاطع الفيديو الموصى بها لمشاهدي مقاطع الفيديو على قنوات YouTube مع ما لا يقل عن 250 ألف مشترك. نظرًا لعدم وجود قائمة شاملة أو معترف بها رسميًا لجميع مقاطع الفيديو أو قنوات الفيديو (بأي حجم) على YouTube ، طور مركز بيو للأبحاث قائمته المخصصة من 915122 قناة على YouTube واخترت مجموعة فرعية من هذه القنوات التي كان لديها ما لا يقل عن 250 ألف مشترك. تضمنت هذه القائمة التي تمت تصفيتها ما مجموعه 30،481 قناة من قنوات المشتركين العالية ، واستخدمت هذه القنوات كنقاط انطلاق للمشي العشوائي من خلال شبكة التوصية.
بعد الانتهاء من جمع البيانات العشوائية الأولية ، قام الباحثون بعد ذلك بتدريب خوارزمية تحديد القنوات الناطقة باللغة الإنجليزية وتصفية المسارات العشوائية لأسفل إلى تلك التي نشأت على واحدة من 14509 قنوات (أو 48 ٪ من القائمة الأصلية من 30،481 قناة شعبية) التي تم تحديدها لاستخدام اللغة الإنجليزية كلغة أساسية. في المجموع ، بدأت 174،117 جولة عشوائية على واحدة من هذه القنوات ، واستخدمت هذه المسارات كأساس لتحليل التقرير.
تطوير قائمة القنوات المخصصة المستخدمة في هذه الدراسة ، بالإضافة إلى "المشي العشوائي "التحليل المستخدم لدراسة التوصيات التي وضعتها خوارزمية YouTube ، يتم مناقشتها كلًا بمزيد من التفصيل أدناه.
تطوير قائمة القنوات
تم تطوير قائمة القنوات المخصصة المستخدمة في هذه الدراسة باستخدام عملية تكرارية متعددة الخطوات. أولاً ، استخدم الباحثون واجهة برمجة تطبيقات YouTube لإنشاء قائمة مبدئية بالقنوات تتألف من ما يلي:
- القنوات المرتبطة بأكثر من 50 مقطع فيديو شائعًا في ذلك الوقت في كل فئة من فئات الفيديو كما هو محدد بواسطة واجهة برمجة تطبيقات YouTube
- الأكثر شيوعًا 100 قناة بشكل عام
- القنوات الأكثر شيوعًا في ذلك الوقت في كل فئة قناة
استوعب الباحثون مقاطع الفيديو الخمسة الأكثر مشاهدة من كل قناة في هذه القائمة الأولية ، ثم التقطوا أهم خمس مقاطع فيديو اقترحها محرك توصيات YouTube لـ كل من مقاطع الفيديو الخمسة الأكثر مشاهدة ، مما أدى إلى الحصول على 25 مقطع فيديو لكل قناة. ثم قاموا بجمع بيانات القناة لكل مقطع فيديو من أصل 25 مقطع فيديو وكرروا العملية المذكورة أعلاه مرة أخرى لأي من هذه القنوات ليس في القائمة الأولية. بالإجمال ، كان من الممكن أن تحدد هذه العملية ما يصل إلى 650 قناة جديدة لكل قناة في القائمة الأولية (25 في الخطوة الأولى و 625 في الثانية).
من قائمة القنوات التي تم جمعها أعلاه ، استخدم الباحثون واجهة برمجة تطبيقات YouTube لإجراء يمشي عشوائيًا عبر الموقع بحثًا عن قنوات جديدة. كل خطوة عشوائية ستقوم بتنفيذ الخطوات التالية:
- حدد قناة من هذه القائمة عشوائياً.
- عند اختيار قناة ، قم باختيار واحد من أفضل خمسة مقاطع فيديو في ذلك الوقت لتلك القناة حسب ترتيبها حسب الصلة ، والتاريخ نشر أو تقييم أو عدد المشاهدات. تم اختيار المعيار المستخدم لكل مسار بشكل عشوائي قبل تحديد مقطع فيديو.
- حدد عشوائيًا مقطع فيديو جديدًا من أهم خمس مقاطع فيديو مقترحة لهذا الفيديو ، كما هو موضح في واجهة برمجة تطبيقات YouTube في ذلك الوقت.
- استخدام الفيديو الموصى به كنقطة بداية جديدة ، حدد فيديو جديدًا بشكلٍ عشوائي من أهم خمس توصيات لهذا الفيديو وكرر هذه الخطوة إلى أن تم اتباع أربع توصيات.
- بعد مواجهة خمسة مقاطع فيديو (بداية الفيديو بالإضافة إلى أربع توصيات متتالية) ، توقف
نظرًا لأن البرنامج صادف مقاطع فيديو من قنوات لم يتم تضمينها في القائمة الأولية ، فستتم إضافة هذه القنوات إلى القائمة وإتاحتها للاختيار في بداية الجولة العشوائية التالية. سمح بتشغيل هذه العملية لمدة أربعة أشهر تقريبًا ، حتى يتم التعرف على عدد قليل من القنوات الجديدة. في المجموع ، أجرى الباحثون 385،187 مثل هذه المسارات العشوائية عبر الشبكة خلال هذه العملية ، مما أدى في النهاية إلى إنشاء قائمة تضم 809693 قناة.
قام الباحثون مرة أخرى باستدعاء واجهة برمجة التطبيقات لتحديد القنوات لأفضل 50 مقطع فيديو في كل فئة فيديو ، وأفضل 100 قناة بشكل عام ، وأفضل القنوات في كل فئة قناة ، كما تم في المرحلة الأولى من هذه العملية. كما وسع الباحثون قائمة القنوات هذه بـ 26،189 قناة إضافية ، كل منها مع ما لا يقل عن 250،000 مشترك ، والتي تم تحديدها في سياق تحليل المسارات العشوائية الموصوفة أعلاه.
لكل قناة ، كرر الباحثون عملية تحديد القناة أعلى خمسة مقاطع فيديو الأكثر مشاهدةً وجمع أفضل خمس توصيات فيديو لكل مقطع من مقاطع الفيديو هذه. تم جمع بيانات القناة لكل قناة جديدة ظهرت في هذه التوصيات ، وأضيفت أي قناة جديدة لديها ما لا يقل عن 250،000 مشترك لقائمة القنوات الحالية. في كل مرة تصادف فيها العملية مقطع فيديو من قناة ليست في القائمة الأصلية التي بها 250 ألف مشترك على الأقل ، ستتم إضافة هذه القناة وإتاحتها للاختيار المستقبلي. تكررت هذه الخطوة بأكملها حتى لم يتم العثور على المزيد من قنوات المشتركين.
كمصدر إضافي للقنوات التي كانت مفقودة في قائمتنا الأولية ، قام الباحثون بتفتيش YouTube API لـ 218 كلمة رئيسية مختلفة تتعلق بمجموعة واسعة من المواضيع. وإضافة أي قنوات في أهم 50 كلمة مطابقة لكل كلمة رئيسية (مرتبة حسب مقياس "مدى الصلة" الداخلي الخاص بـ API) إذا لم تكن هذه القنوات موجودة بالفعل في قاعدة البيانات الخاصة بنا. جمع الباحثون أيضًا قائمة بأهم قنوات YouTube من شركة التحليلات عبر الإنترنت SocialBlade. تم إنشاء هذه القائمة في 13 تموز (يوليو) 2018 ، وتتضمن أفضل 5000 قناة مؤثرة في SocialBlade وأفضل 250 مستخدمًا لمستخدمي YouTube في الولايات المتحدة ، بالإضافة إلى أهم قنواتهم في الفئات التالية: الحيوانات ، والسيارات ، والكوميديا ، والتعليم ، والترفيه ، والأفلام ، والألعاب و [[NS]] ، والموسيقى ، والأخبار ، والمنظمات غير الربحية ، والناس ، والعروض ، والرياضة ، والتقنية ، والسفر
من بين أفضل 5000 قناة وأفضل القنوات الأمريكية البالغ عددها 250 قناة كما تم تجميعها بواسطة SocialBlade ، كانت نسبة 95٪ و 96٪ على التوالي تم تحديدها في خطوات اكتشاف القناة التي أجريناها. وقد حدد تطوير القناة أيضًا ما متوسطه 89٪ من القنوات في قوائم الفئات الـ16 الأخرى التي تحتفظ بها SocialBlade. لملء الفجوات المتبقية ، حاول الباحثون تحديد أي قنوات فريدة موجودة في قوائم SocialBlade باستخدام واجهة برمجة تطبيقات YouTube ، وتنزيل إحصاءات المشتركين في القنوات وإضافتها إلى قائمة العينات أي قنوات تم تحديدها مؤخرًا تضم 250 ألف مشترك على الأقل. ثم تم تكرار تحليل المسارات العشوائية مرة أخرى ، إلى أن لم يتم تحديد قنوات جديدة للمشتركين.
عند الانتهاء من الخطوات المذكورة أعلاه ، تحتوي قاعدة بيانات القناة الآن على ما مجموعه 915122 قناة من أي حجم. بعد إزالة أي قنوات يقل عدد المشتركين فيها عن 250،000 مشترك ، حددت عملية التعيين المذكورة أعلاه في النهاية إجمالي 30،481 قناة فريدة مع ما لا يقل عن 250،000 مشترك. تم استخدام هذه المجموعة من 30،481 قناة بعد ذلك كأساس لمجموعة لاحقة من توصيات الفيديو الفردية (انظر القسم التالي للحصول على التفاصيل).
مجموعة "تمشي عشوائية" لتوصيات الفيديو الفردية
بعد تحديد قائمة من كبار المشتركين من خلال استخدام العملية المذكورة أعلاه ، أجرى الباحثون بعد ذلك تحليلاً جديدًا عشوائيًا للمشي لتحديد مقاطع الفيديو الفردية والتوصيات ضمن قنوات المشتركين العالية. استخدمت هذه المسارات العشوائية أيضًا واجهة برمجة تطبيقات YouTube العامة وعملت بطريقة مماثلة تقريبًا لتلك المستخدمة في اكتشاف القنوات الجديدة أثناء تطوير قائمة القنوات نفسها.
أولاً ، ستختار العملية قناة عشوائية من قائمة 30،481 قناة بداية. بعد ذلك ، ستنشئ معيار اختيار عشوائيًا بعيدًا عن مدى الصلة ، أو تاريخ النشر ، أو تقييم المستخدم أو عدد المشاهدات ، واختيار واحد من أفضل خمسة مقاطع فيديو في هذه القناة في الوقت الحالي بناءً على معيار الاختيار هذا. عندئذٍ ، يتم اختيار أحد أهم خمسة مقاطع فيديو موصى بها بشكل عشوائي في واجهة برمجة التطبيقات لهذا الفيديو ، وتكرار هذه العملية ثلاث مرات أخرى. عند هذه النقطة ، سيتم إيقاف السير العشوائي - المكون من فيديو بدء وأربعة توصيات فيديو متتالية - وبدأت عملية جديدة.
في كل "خطوة" من مسيرة معينة ، سيقوم البرنامج بجمع مجموعة متنوعة من المعلومات حول الفيديو المحدد - مثل العنوان أو الطول أو عدد المشاهدات أو الفئة أو تاريخ النشر أو عدد التعليقات. أجرى المركز 340،244 من هذه المسارات العشوائية خلال الفترة من 18 يوليو إلى أغسطس. 29 ، 2018.
تصفية إلى القنوات الناطقة باللغة الإنجليزية
كخطوة أخيرة في التحليل بعد اكتمال عملية اختيار القناة الأولية وعملية المشي العشوائي ، أزال الباحثون أي مناحي نشأت من القنوات التي لم تكن الإنجليزية لغتها الأساسية . يمكن أن تقدم واجهة برمجة تطبيقات YouTube معلومات عن اللغة والبلد المرتبط بأي قناة معينة ، ولكن هذه المعلومات غالبًا ما تكون مفقودة. من أجل الحد من إطار أخذ العينات الأولي إلى YouTube الناطق باللغة الإنجليزية ، كان على الباحثين ملء هذه المعلومات المفقودة وتحديد القنوات باللغة الإنجليزية.
عبر عملية تطوير قائمة وجمع البيانات الخاصة بالقناة بأكملها ، جمع الباحثون معلومات حول ما مجموعه 1.029859 قناة. ومن بين هؤلاء ، كان 2.6٪ (26،531) لديهم معلومات لغوية بالإضافة إلى قصاصة (عنوان / وصف) ومعلومات عن علامة الموضوع. من هذه المجموعة الفرعية من القنوات ، رسم الباحثون عينة من 11،874 ، ثم قاموا بتدريب مصنف XGBoost لتحديد القنوات الإنجليزية باستخدام الميزات التالية:
- رمز البلد الخاص بالقناة ، إذا كان متاحًا.
- علامات ثنائية لأي علامات موضوع تم تعيينها إلى القناة من خلال واجهة برمجة تطبيقات YouTube.
- ميزات تكرار تكرار عكسي للوثيقة بتردد زمني (TF-IDF) (60٪ كحد أقصى لتكرار المستند ، 10 مستندات كحد أدنى ، 1-5-جرام ، 15000 ميزة كحد أقصى) استنادًا إلى العنوان والوصف من قناة
- ميزات TF-IDF كلمة (60 ٪ الحد الأقصى من وتيرة الوثيقة ، و 10 وثيقة كحد أدنى ، 1-2 غرام ، و 15،000 ميزات قصوى) على أساس عنوان ووصف القناة.
- عبر جميع مناحي عشوائية في الدراسة التي واجهت القناة ، نسبة القنوات الأخرى التي تمت مواجهتها في تلك المسارات العشوائية التي تم تمييزها لكل رمز لغة في YouTube.
- الاحتمالية لتوقعات اللغة استنادًا إلى حزمة بيثون "langdetect" ، مطبقة على العنوان والوصف للقناة.
تم تقييم المصنف باستخدام التحقق المتقاطع من خمسة أضعاف بالإضافة إلى عينة معلقة من 1،188 قناة وتحقيق دقة 90٪ واسترجاعها. تم تطبيقه بعد ذلك على جميع القنوات التي كانت تحتوي على معلومات لغوية مفقودة. وأخيرًا ، باستخدام تنبؤات اللغة الجديدة ، تم ترشيح المجموعة الأولية من 340،244 من المسارات العشوائية إلى تلك التي بدأت على قناة اللغة الإنجليزية (تم تحديد 47 ٪ من قنوات البذور الأولية لتكون غير الإنجليزية) ، مما أدى إلى إجمالي النهائي. 174،117 جولة عشوائية ، بدأ كل منها من 14509 قنوات باللغة الإنجليزية. في المجموع ، واجهت هذه المسارات العشوائية 696،468 من مقاطع الفيديو المقترحة إلى 346،086 مقطع فيديو فريدًا.
© Pew Research Center، 2018
[ad_2]