بعد أن كان تحديد هوية الأشخاص في التحقيقات الجنائية والطب الشرعي يتم باستخدام بصمات أصابعهم، ثم تحليل الحمض النووي، مروراً بتحليل الصوت، ثم بصمة العين، نشهد اليوم تحديد هوية كاتب نص على المنصات الإلكترونية، ربما بذات الدقة، باستخدام ما يُسمى تحليل "بصمة النص".
ويسعى مطورون داخل وحدة أبحاث تابعة للمخابرات الأميركية، لاستخدام تقنية تم بناؤها لمكافحة التضليل عبر الإنترنت، من أجل تحديد هُوية شخص ما من خلال طريقة كتابته عبر وسائل التواصل الاجتماعي باستخدام الذكاء الاصطناعي.
وبحسب موقع "نيكستغوف" الأميركي المتخصص، يعمل الخبراء في وحدة مشاريع بحوث الذكاء المتقدم ( IARPA)، وهي جناح بحثي تابع لأجهزة الاستخبارات الأميركية، على استخدام الذكاء الاصطناعي ضمن برنامج يدعى (HIATUS)، لتحليل البنية الخفية للنصّ عبر الإنترنت، وإسناده لصاحبه.
وتعمل تقنية البصمات النصية الجديدة بشكل مشابه للطريقة التي يحدد من خلالها خبراء الطب الشرعي حالياً هوية شخص ما بناء على خط يده، فمثلما يتميز البشر بوجود اختلافات فردية صغيرة بينهم تحدد خصوصياتهم في الطريقة التي يكتبون بها كلمة ما، فإن المؤلفين عبر الإنترنت لديهم أيضاً نصوصهم وأساليبهم الخاصة عند صياغة الجمل عبر الإنترنت، وما يقوم به البرنامج هو تحديد السمات الكتابية مثل: وضع الكلمات وبناء الجملة، التي يمكن من خلالها تحديد من كتب نصاً معيناً، تماماً مثل بصمة إصبعك.
وقال د. زياد صرايرة، الخبير في الذكاء الاصطناعي: هذه التقنية تعتمد بشكل أساسي على خوارزميات من الجيل الثالث المتعلقة بالشبكات الحديثة والتعلم العميق، وذلك خلافاً لخوارزميات الجيل الأول والثاني التي كانت تعتمد على تطابق الكلمات أو ما يدعى (chat bot)، أو حتى التحليل البشري للبيانات المتاحة عند البحث عن شخص محدد أو معلومة محددة.
ويضيف "بل يبحث هذا البرنامج عن أنماط جملة معينة وليس فقط كلمات، وعلى التكرار في نمط الكلام، والتكرار نقطة أساسية في التوصل إلى نتائج دقيقة.. فإذا سألت 100 شخص نفس السؤال أو طلبت منهم وصف شيء ما فستحصل على احتمالات لامتناهية من الإجابات لا يمكن أن تتطابق".
ويختم صرايرة إن "كمية المعلومات التي تعالجها هذه الخوارزميات وتعمل بنظام عمليات بحث وبرمجة خاصة تخضع لغربلة البيانات حيث تمر بعدة مراحل، ثم يتم تأكيد المعلومات بكل مرحلة منها.. أي أن الإمكانات البشرية غير قادرة أن تحقق نفس النتائج".
ويأمل الباحثون أن تلعب تقنية "بصمة النص" دوراً كبيراً في تحديد هوية أصحاب حملات التضليل والاتجار بالبشر من خلال تحديد السمات الأسلوبية مثل وضع الكلمات وصياغة الجملة والأسلوب.
ونشر تقرير لشركة (imperva) للأمن السيبراني في العام 2020 أن أكثر من ربع مستخدمي الإنترنت ليسوا بشراً، وإنما حسابات آلية قد تنشر المعلومات المضللة أو البذاءات وغيرها، هذا غير استخدام بشر لأسماء مستعارة.
وبصرف النظر عن الجدل حول استخدام هذه التقنية، فهي بالتأكيد قفزة نوعية ضمن سلسلة تقنيات تحديد هوية الأشخاص في استخدام التكنولوجيا.
ويتطلع فريق خبراء (HIATUS) إلى تحليل البنية المخفية للنصّ عبر الإنترنت وإسناده لصاحبه، أو للاستفادة من "بصمة النص" في تطوير أنظمة يمكن أن تكون ذات أداء قوي عبر مجالات وأنواع متنوعة من النصوص، مع تضمين العديد من اللغات الأجنبية في البرنامج أثناء تشغيله قبل إرساله إلى الوكالات الأمنية والاستخباراتية لتنفيذه بناء على احتياجاتها الخاصة، ولهذا السبب لا يتكهّن المسؤولون بتفاصيل كبيرة حول حالات الاستخدام التي يمكن أن تزدهر على طول الخط، أكثر مما كان مخططاً.