ไม่เป็นความลับที่การเมืองของสหรัฐฯมีการแบ่งขั้วสูง
ถึงกระนั้น อาจมีชาวอเมริกันที่อาศัยอยู่ไม่กี่คนบาคาร่าออนไลน์ที่เคยเห็นสิ่งที่เปรียบเทียบได้กับ การดีเบ ตชิงตำแหน่งประธานาธิบดีครั้งแรกของฤดูใบไม้ร่วงนี้
จริงหรือไม่ที่ประเทศชาติไม่สามารถทำอะไรได้ดีไปกว่าการต่อสู้ด้วยวาจาโดยมีผู้สมัครสองคนดูถูกเหยียดหยามเกรดสี่และพูดคุยกัน?
สำหรับเรา การโต้วาทีที่ไม่ลงรอยกันเป็นอีกอาการหนึ่งของวาทกรรมของพลเมืองที่คลั่งไคล้ในประเทศ ซึ่งในการศึกษาเมื่อเร็วๆ นี้ เราสามารถแสดงให้เห็นการขยายขอบเขตของคำที่เราใช้พูดถึงการเมือง
เมื่อต้นปีนี้ เราเริ่มสร้างชุดข้อมูลที่ประกอบด้วยความคิดเห็นของผู้ชมทั้งหมดบนวิดีโอ YouTube ที่โพสต์โดยเครือข่ายโทรทัศน์สี่เครือข่าย ได้แก่ MSNBC, CNN, Fox News และOne America News Networkซึ่งกำหนดเป้าหมายไปยังส่วนต่าง ๆ ของสเปกตรัมทางการเมือง ชุดข้อมูลนี้มีความคิดเห็นมากกว่า 85 ล้านความคิดเห็นในวิดีโอมากกว่า 200,000 รายการจากผู้ชม 6.5 ล้านคนตั้งแต่ปี 2014
เราศึกษาว่ามีรูปแบบที่แตกต่างกันของภาษาอังกฤษที่เขียนในส่วนความคิดเห็นหรือไม่ ซึ่งคล้ายกับความแตกต่างระหว่างภาษาอังกฤษแบบอังกฤษและ ภาษาอังกฤษ แบบอเมริกัน
เราพบว่ามีการเรียงสับเปลี่ยนเหล่านี้โดยใช้วิธีการเรียนรู้ของเครื่อง ยิ่งไปกว่านั้น เราสามารถจัดอันดับพวกเขาในแง่ของ “ความถนัดซ้าย” และ “ความถูก” ตามความรู้ของเรา นี่คือการสาธิตเชิงประจักษ์ครั้งแรกของความแตกต่างทางภาษาเชิงปริมาณในผู้ฟังข่าว
อย่างไรก็ตาม การค้นพบครั้งที่สองของเรานั้นเป็นสิ่งที่คาดไม่ถึงมากกว่านั้น
ระบบการแปลด้วยแมชชีนเลิร์นนิงของเราพบว่ามีการใช้คำที่มีความหมายต่างกันมาก เช่น “KKK” และ “BLM” ในบริบทเดียวกันโดยขึ้นอยู่กับช่อง YouTube ที่กำลังวิเคราะห์
บริษัท คำรักษา
เมื่อแปลสองภาษาที่แตกต่างกัน เช่น สเปนและอังกฤษ ระบบการแปลอัตโนมัติ เช่น Google Translate จะเริ่มต้นด้วยชุดข้อความฝึกอบรมจำนวนมากในทั้งสองภาษา จากนั้นระบบจะใช้วิธีการเรียนรู้ของเครื่องเพื่อการแปลที่ดีขึ้น
ในช่วงหลายปีที่ผ่านมาเทคโนโลยีนี้มีความแม่นยำมากขึ้น ต้องขอบคุณข้อมูลเชิงลึกที่สำคัญสองประการ
ครั้งแรกย้อนหลังไปถึงปี 1950 เมื่อนักภาษาศาสตร์John Rupert Firthคิดคำพังเพยว่า “คุณจะรู้คำศัพท์โดย บริษัท ที่มันเก็บไว้”
สำหรับระบบแปลภาษาสมัยใหม่ “บริษัท” คำที่เก็บไว้คือ “บริบท” หรือคำที่อยู่รอบๆ ตัวอย่างเช่น คำภาษาอังกฤษ “องุ่น” เกิดขึ้นในบริบทเช่น “น้ำองุ่น” และ “เถาองุ่น” ในขณะที่คำที่เทียบเท่าในภาษาสเปนuvaเกิดขึ้นในบริบทเดียวกัน – jugo de uva , vid de uva – ในประโยคภาษาสเปน .
การค้นพบที่สำคัญครั้งที่สองมาค่อนข้างเร็ว การศึกษาในปี 2013พบวิธีการระบุ – และด้วยเหตุนี้จึงเชื่อมโยง – บริบทของคำในภาษาหนึ่งไปยังบริบทในอีกภาษาหนึ่ง การแปลด้วยคอมพิวเตอร์สมัยใหม่ขึ้นอยู่กับกระบวนการนี้เป็นอย่างมาก
สิ่งที่เราได้ทำคือการใช้การแปลประเภทนี้ในรูปแบบใหม่ทั้งหมด : เพื่อแปลภาษาอังกฤษเป็นภาษาอังกฤษ
เมื่อ ‘Trumptards’ กลายเป็น ‘เกล็ดหิมะ’
นั่นอาจฟังดูแปลกประหลาด ทำไมต้องแปลภาษาอังกฤษเป็นภาษาอังกฤษ?
ลองพิจารณาภาษาอังกฤษแบบอเมริกันและอังกฤษแบบอังกฤษ หลายคำเหมือนกันทั้งสองภาษา ทว่าอาจมีความแตกต่างเล็กน้อย ตัวอย่างเช่น “อพาร์ตเมนต์” ในภาษาอังกฤษแบบอเมริกันอาจแปลว่า “แฟลต” ในภาษาอังกฤษแบบอังกฤษ
เพื่อจุดประสงค์ในการศึกษาของเรา เราได้ติดป้ายกำกับภาษาที่ใช้ในส่วนความคิดเห็นของแต่ละเครือข่ายว่า “MSNBC-English,” “CNN-English,” “Fox-English” และ “OneAmerica-English” หลังจากวิเคราะห์ความคิดเห็น อัลกอริธึมการแปลของเราได้เปิดเผยรูปแบบที่แตกต่างกันสองแบบของ “คำที่ไม่ตรงแนว” – คำที่ไม่เหมือนกันในส่วนความคิดเห็น แต่ใช้ในบริบทเดียวกัน
ประเภทหนึ่งคล้ายกับ “แฟลต” และ “อพาร์ตเมนต์” ในแง่ที่ทั้งสองอธิบายอย่างชัดเจนว่าเป็นสิ่งเดียวกัน อย่างไรก็ตาม คู่คำที่เราค้นพบนั้นมีน้ำเสียงที่แตกต่างกัน ตัวอย่างเช่น เราพบว่าสิ่งที่ชุมชนหนึ่งเรียกว่า “เปโลซี” อีกชุมชนหนึ่งเรียกว่า “เปลูซี”; และ “Trump” ในภาษาข่าวหนึ่งแปลเป็น “Drumpf” ในอีกภาษาหนึ่ง
ประเภทที่สองและลึกกว่านั้นเกิดขึ้นเมื่อคำสองคำอ้างถึงสองสิ่งที่แตกต่างกันโดยพื้นฐาน
ตัวอย่างเช่น เราพบว่าใน CNN-English “KKK” – ตัวย่อของ Ku Klux Klan – ถูกแปลโดยอัลกอริทึมของเราเป็น “BLM” – ชวเลขสำหรับ Black Lives Matter – ใน Fox-English อัลกอริทึมพบว่าความคิดเห็นของชุมชนหนึ่งเกี่ยวกับ KKK นั้นเหมือนกับความคิดเห็นของชุมชนอื่นเกี่ยวกับ BLM มาก แม้ว่าระบบความเชื่อของ KKK และ BLM จะแตกต่างกันมากเท่าที่จะเป็นได้ ทั้งนี้ขึ้นอยู่กับส่วนความคิดเห็น ดูเหมือนว่าแต่ละระบบจะแสดงสิ่งที่เป็นลางไม่ดีและคุกคามในทำนองเดียวกัน
CNN-English และ Fox-English ไม่ได้เป็นเพียงสองภาษาที่แสดงประเภทที่ไม่ตรงแนวนี้ จุดสิ้นสุดของสเปกตรัมนั้นแบ่งออกเป็นสองภาษา ตัวอย่างเช่น “mask” ใน Fox-English แปลว่า “muzzle” ใน OneAmerica-English ซึ่งสะท้อนถึงทัศนคติที่แตกต่างกันในชุมชนย่อยเหล่านี้
ดูเหมือนว่าจะมีความเป็นคู่เหมือนมิเรอร์ที่เล่น “อนุรักษ์นิยม” กลายเป็น “เสรีนิยม” “สีแดง” แปลว่า “สีน้ำเงิน” ในขณะที่ “คูเปอร์” ถูกแปลงเป็น “ฮันนิตี้”
นอกจากนี้ยังไม่มีสิ่งที่เรียกว่าการเรียกชื่อแบบเด็ก ๆ เท่านั้น
“Trumptards” ใน CNN-English แปลว่า “ เกล็ดหิมะ ” ในภาษา Fox-English; “Trumpty” ใน CNN-English แปลว่า “Obummer” ในภาษา Fox-English; และ “republicunts” ใน CNN-English แปลว่า “democraps” ในภาษา Fox-English
ดินแดนที่ไม่จดที่แผนที่
นักภาษาศาสตร์ได้เน้นย้ำมานานแล้วว่าการสื่อสารที่มีประสิทธิผลระหว่างผู้ที่มีความเชื่อต่างกัน นั้น จำเป็นต้องมีพื้นฐานร่วมกันอย่างไร การค้นพบของเราแสดงให้เห็นว่าวิธีที่เราพูดถึงประเด็นทางการเมืองนั้นแตกต่างกันมากขึ้น ขึ้นอยู่กับว่าใครเป็นคนเขียน คำทั่วไปอาจแฝงไปด้วยความหมายที่ต่างไปจากเดิมอย่างสิ้นเชิง
เราสงสัยว่าเราอยู่ไกลจากจุดที่ไม่มีทางหวนกลับได้ไกลแค่ไหนเมื่อความแตกต่างทางภาษาเหล่านี้เริ่มกัดเซาะจุดร่วมที่จำเป็นสำหรับการสื่อสารที่มีประสิทธิผล
ห้องสะท้อนเสียงในโซเชียลมีเดียทำให้การแบ่งขั้วทางการเมืองรุนแรงขึ้นจนถึงจุดที่ความคลาดเคลื่อนทางภาษาเหล่านี้ฝังแน่นในวาทกรรมทางการเมืองหรือไม่?
“ประชาธิปไตย” ในภาษาหนึ่งจะหยุดแปลเป็น “ประชาธิปไตย” ในอีกภาษาหนึ่งเมื่อใดบาคาร่าออนไลน์