เห็น Blog มันว่างๆก็เลยหาอะไรมาใส่ซะหน่อย คราวนี้ของเป็นเรื่องของ ความลึกลับอย่างหนึ่งของงานทางคณิตศาสตร์เลยก็ว่าได้ ไม่เชื่ออย่าลบหลู่ เรื่องที่ทำให้เกิดข้อถกเถียงกันอยู่พักนึงถึงเรื่องความเป็นจริงซึ่งขัดกับสามัญสำนึกของเราๆ ท่านๆ กันนะครับ
เรื่องราวมันก็มีอยู่ว่าถ้าเรามีข้อมูลเชิงปริมาณของอะไรซักชุดหนึ่งตามธรรมชาติ (ให้มันมีความแตกต่างเรื่องหลักกันหน่อยก็ดีนะ) จากนั้นเราก็เอาข้อมูลนั้นมาทำการนับจำนวนเลขหลักหน้า เช่น 1432,177,189 เลขหลักหน้าคือ 1
ดูให้ครบทุกจำนวนในชุดข้อมูล เพื่อที่จะดูว่า มีเลขอยู่กี่ตัวที่มีหลักหน้าเป็น 1 กี่ตัวที่หลักหน้าเป็น 2 ................... และกี่ตัวที่เลขหลักหน้าเป็น 9 เมื่อคุณทำจนเสร็จคุณคิดว่าผลที่ออกมาได้จะเป็นอย่างไงละครับ
คำตอบตามสามัญสำนึกของคนหลายๆคนก็คงคิดว่าจำนวนของ ข้อมูลที่ขึ้นต้นด้วยเลขตัวไหนๆ ก็คงจะมีอยู่จำนวนเท่าๆกันสินะครับ แต่จริงๆแล้ว ไม่เลยครับ
ตามกฏของเบนฟอร์ด บอกไว้ว่า จำนวนข้อมูลที่ขึ้นต้นด้วยตัวเลขหนึ่งจะมีจำนวนมากที่สุด และจะมีมากถึงประมาณ 30 % ซึ่งจริงๆแล้วควรจะเป็น 11.11% (หรือ หนึ่งในเก้า) และจะน้อยลงเรื่อยๆตามจำนวนตัวเลขที่เพิ่มขึ้นจนถึงเลข 9 อาจจะเหลือเพียงประมาณ 5%
ครั้งแรกที่ผมอ่านเรื่องนี้ก็คิดว่าในใจว่า “นี่มันทฤษฏีลวงโลกอะไรกันนี่ ก็มันจะเป็นจริงได้อย่างไง”
แต่มันก็ต้องมาลองให้เห็นกับตาตัวเองซักหน่อย แล้วความจริงที่หน้าตกตะลึกก็ปรากฏต่อหน้าต่อตา ทำเอาขนลุกกันเลยทีเดียว
ไม่เชื่ออย่าลบหลู่ครับ ไปลองดูด้วยตาตัวเองสิ
อันนี้ของมูลจริงจาก Wikipedia
จะเห็นได้ว่ามีจำนวนที่ขึ้นต้นด้วยเลขหนึ่งถึง 64 จำนวน จาก 224 จำนวน คิดเป็น 28.5 % ในขณะที่จำนวนที่ขึ้นต้นด้วยเลข 9 มีเพียง 7 จำนวน หรือ 3.1 % เท่านั้นเองครับ
ความน่าจะเป็นที่ข้อมูลหนึ่งจะมีตัวเลขหลักแรกเป็น n
กฏของเบนฟอร์ด บอกไว้ถึงฟังก์ชั้นแจกแจงความน่าจะเป็นของความน่าจะเป็นออกเป็นฟังก์ชัน log ตามนี้ครับ
ซึ่งถ้าเป็นไปตามสำนึกของเราๆก็จะเป็น
แฮปปี้คนเลี้ยงหมู
เรามาต่อกันด้วยอะไรที่มันใกล้ตัวเราเพิ่มขึ้นไปอีกดีกว่า หลายๆคนคงเล่น หรืออย่างน้อยก็เคยรู้จักเกม แฮปปี้คนเลี้ยงหมู กันมาบ้างนะครับ(สมัยนี้ไม่รู้ก็ ไม่รู้จะพูดไง) พอเวลาเปิดดูลำดับยอดเงินของเพื่อนเราแต่ละคนมีใครได้เคยสังเกตเห็น ความเป็นจริงทางคณิตศาสตร์ตรงนี้มาก่อนบ้างไหม อันนี้เป็นข้อมูลคอกหมูจากเพื่อนของผม 102 คน
พอเราเอามาแยกตามเลขหลักหน้าก็จะได้เป็น
ได้เป็นกราฟหน้าตาเป็นแบบนี้
พอเรามาเทียบกับก็ของ Benford กับตามจิตสำนึกเรา แบบเป็นร้อยละก็จะได้แบบนี้
โดย
สีฟ้าเป็น เปอร์เซ็นต์ข้อมูลจากแฮปปี้คนเลี้ยงหมูของผม
สีแดงเป็น เปอร์เซ็นต์ข้อมูลตาม Benford's Law
สีชมพูเป็น เปอร์เซ็นต์ตามจิตสำนึกของเรา
จะเห็นได้อย่างชัดเจนว่าแนวโน้มมันไปตาม กฏของ Benford จริงอย่างน่าประหลาดใจ
ถ้ายังไม่พอใจ เป็นคนแบบผมที่ไม่ยอมเชื่ออะไรง่ายๆ ก็ลองดูเพิ่มก็ได้นะคับ
ลองนับจำนวนกันดูเล่นๆ จนกว่าจะพอใจ
ความสูงของตึกต่างๆในโลกความยาวของแม่น้ำสายต่างๆในโลกนี้
จำนวนเหยื่อในคดีดังๆ
จำนวนผู้ใช้งานของ Social Network ต่างๆ
แล้วเราจะเอาความรู้เรื่องนี้มาใช้ประโยชน์อย่างไงละ
หลักๆเลยนะครับ ในกรณีที่มีข้อมูลที่มีที่มาตามธรรมชาติ อย่างหนึ่งแต่ข้อมูลนั้นมีการแจกแจงตัวเลขหลักหน้าแต่ละเลขนั้นดันมีจำนวนเท่ากัน เราก็จะรู้ได้ทันทีเลยว่าข้อมูลนั้นเป็นของปลอม เพราะเวลาคนเราส่วนใหญ่ปลอมข้อมูลก็จะสุ่มตัวเลขไปเรื่อยๆ ไม่ได้ใส่ใจกฏข้อนี้
อีกอย่างนึงคือเรื่องนี้เป็นเรื่องที่ยังใหม่อยู่ พึ่งค้นพบกันในรอบร้อยปีนี้เอง เจ้าของกฏนาย Frank Albert Benford เองก็ทำไว้เมื่อปี 1938
จึงเป็นสิ่งที่น่าคิดว่าเรื่องที่ไม่น่าจะยากอย่างนี้ทำไมถึงไม่มีใครใส่ใจกันเลยหรือ......น่าสงสัย
0 ความคิดเห็น:
แสดงความคิดเห็น