像鬥牛犬辯護者這樣的人喜歡試圖讓我們其他人相信,我們無法分辨鬥牛犬和其他不是鬥牛犬的狗。 但我幾天前組織了一個遊戲,向你們中的數百萬人展示了你們可以做到。 那個遊戲是 pitguesser。這裡有一些數據。 首先,pitguesser(點)com 有三種遊戲模式。其中一種基於所有當代研究中使用的相同設計,這些研究聲稱人們無法識別鬥牛犬。這個設計被稱為「品種猜測」,它讓你查看一組主要是混種狗的樣本,並猜測它們的基因組成的所有品種。 這顯然無法告訴我們鬥牛犬是否可識別,因為這是一個過高且不相關的識別標準。 然而,其他遊戲模式確實允許我們測試人們能否識別鬥牛犬的命題。 人們在一般看狗時表現得非常好,只需選擇「是」來表示一隻狗是否是鬥牛犬,選擇「否」來表示它們不是。類似地,鬥牛犬辯護者喜歡引用的一項研究,因為識別極度混合的鬥牛犬的準確性較低,實際上發現鬥牛犬的祖先越多,正確分類鬥牛犬的可能性越高: 正如你所見,那項研究發現,當鬥牛犬的祖先超過 80% 時,這些狗能夠被完美識別。我們關心這些狗的任何祖先,因為任何數量都意味著作為鬥牛犬的視覺可識別性更高,因此被分類為鬥牛犬的機率更大,而我們知道這就是我們每年統計死亡人數的方式。 在第三種遊戲模式中,我稱之為「鬥牛犬還是朋友」,玩家必須在兩隻隨機選擇的狗之間選擇,其中一隻有鬥牛犬的祖先,另一隻則沒有。他們通常能正確選擇,並達到 83.4% 的準確率,而隨機猜測的準確率僅為 50%。 這太棒了!這意味著如果在鬥牛犬和非鬥牛犬之間存在某種「潛在鬥牛外觀」或「鬥牛特徵」的變異,那麼對於這一點的 Cohen's d——假設方差相等——是驚人的 1.37。 但鬥牛犬的樣本混合得很厲害,平均只有 31.6% 的鬥牛犬祖先,因此要獲得「真正的」鬥牛犬與非鬥牛犬的可區分性,我們必須根據平均鬥牛犬祖先是否為 100% 來重新調整 d。如果我們這樣做,結果是 4.34,這是非常巨大的,幾乎沒有重疊。 如果我們再次查看數據,最常見的錯誤是與「鬥犬品種」的狗有關——美國鬥牛犬、拳擊犬、英國鬥牛犬和鬥牛梗——這些狗 (A) 與鬥牛犬來自相同的血統,(B) 通常因為身體和行為原因與它們分組,(C) 通常在使用這些數據的作者所用的 DNA 測試中與它們混淆! 排除這些品種後,準確率上升到 86.1%,導致「純鬥犬」與非鬥犬之間的 d 差距為 4.85。這意味著外觀上只有 1.5% 的重疊。 最後,數據完整性存在問題,這削弱了研究。狗的祖先在所有數據中不總和為 100%,因為我們僅獲得了這些主要是混種狗中觀察到的前四個品種。因此,這部分祖先可能是鬥牛犬,將分佈拉在一起並增加了誤差。如果我們假設 50% 的殘餘是鬥牛犬,外觀的 d 上升到 6.50。如果我們假設它完全是鬥牛犬,則上升到 9.87。 無論如何,鬥牛犬顯然與非鬥牛犬在視覺上極為不同,我們可以輕鬆識別。從視覺上看,這樣看: ...