تعثر البحث العلمي، خير من استمراره .. أحيانا

هنا أطرح قضية واجهتها عدة مرات في المجال الأكاديمي، وهي ظاهرة قد تكون موجودة قديما ولكنها انتشرت حديثا في الأبحاث العلمية خاصة في مجال علم البيانات، وهي نشر أبحاث تعتمد بشكل أساسي على بيانات لا يمكن الوصول لها ولا حتى جمع بيانات مشابهة لها للحصول على نتائج مشابهة بنفس المنهجية العلمية المتبعة.

غالب هذه الأبحاث تكون منشورة من قبل باحثين يعملون في شركات تقنية معلومات كبرى مثل Facebook و Twitter. بحيث يكون لديهم وصول لبيانات خاصة للمستخدمين، ومن ثم إجراء تجارب عليها والخروج بنتائج قابلة للنشر من حيث النتائج نفسها. المشكلة هنا أن هذه البيانات لا تنشر (حتى بعد إزالة هوية المستخدمين de-identification)، ولا يوجد أصلا بيانات مشابهة بحيث يتم عمل نفس الأبحاث من جديد. فمثلا موقع Facebook لا يشبهه موقع آخر أبدا لا من حيث الحجم ولا الطريقة، والبيانات الموجودة فيه لا يمكن الوصول لها لأنها مجمعة من حسابات خاصة غالبا. حتى الحسابات المفتوحة public يصعب سحب بيانات منها لوجود قيود على استخدام الواجهة البرمجية API لكثير من التطبيقات (مثل Facebook و Twitter) لسحب كميات كبيرة من المعلومات.

متابعة قراءة “تعثر البحث العلمي، خير من استمراره .. أحيانا”

تخصص علوم الحاسب

يوجد كثير من المقالات التعريفية عن تخصص علوم الحاسب، ولكن هنا سأحاول عرض التخصص بطريقة مختلفة نوعا ما (قد يكون هناك من سبقني لذلك لكن لم أطلع عليه). سأتحدث هنا باختصار عن التخصص وفروع، ومجالات العمل المستقبلية فيه. أنا هنا لا أدعو القارئ أن يتخصص في علوم الحاسب، لكن أوضح له ما هو التخصص حسب خبرتي ودراستي.

متابعة قراءة “تخصص علوم الحاسب”

مصادر تعلم في معالجة اللغات الطبيعية NLP

كورسات على موقع كورسيرا Coursera تتعلق بمجال معالجة اللغات الطبيعية NLP:

  1. البروفيسور دراقومير راديف Dragomir Radev جامعة ميتشقان وكولومبيا. https://www.coursera.org/course/nlpintro
  2. البروفيسور مايكل كولنز Michael Collins جامعة كولومبيا. https://www.coursera.org/course/nlangp
  3. البروفيسور دان جورفاسكي Dan Jurafsky جامعة ستانفورد. https://www.coursera.org/course/nlp
  4. Deep Learning for Natural Language Processing جامعة ستانفورد http://cs224d.stanford.edu/