0

0
1

文字

分享

0
0
1

正妹的祕密-自拍角度剖析

活躍星系核_96
・2014/07/10 ・2259字 ・閱讀時間約 4 分鐘 ・SR值 516 ・六年級

-----廣告,請繼續往下閱讀-----

文 / Jia-Bin Huang|伊利諾大學香檳分校電機工程學系博士候選人

大家都愛自拍,但為什麼有些人自拍出來的照片總是特別地好看?很明顯地自拍時相機與臉之間的相對角度佔了絕大部分的因素。打開網路搜尋,很快地就可以搜尋到非常多相關的擺姿勢技巧教學:

然而這些教學往往太過於抽象而不容易簡單地運用在日常生活中。我們心中不免疑惑,究竟要怎麼樣擺姿勢才是最好看的呢?不同於專家的意見,我們直接試著從資料中找出規律來。我們這裡選了三位網路正妹來做分析:

選擇這三位有兩個主要的原因:第一、她們在臉書上都擁有高人氣,表示大家都相當喜歡他們的狀態更新。第二、我們需要大量的資料進行分析以免得到不可靠的數據,三位正妹在臉書上千張公開自拍照片即成了有用的資料。

-----廣告,請繼續往下閱讀-----

資料處理

要分析正妹們自拍時如何擺POSE,我們得先從影像中估算臉與相機間的相對角度。大致上可以分為三個步驟:

  1. 首先用現成的軟體批次下載正妹們在facebook上公開的照片。
  2. 其次我們用Open CV中的人臉偵測軟體來自動地標示每張照片裡臉部的位置。
  3. 有了臉部的偵測,我們接著運用電腦視覺的技術來估算臉部3D的Pose。

在這裡我們使用空氣動力學中的俯仰(Pitch)、 扭轉(Yaw) 和橫擺(Roll)來表示物體(正妹)與觀測者(相機)間的相對角度。下圖我們借用飛機來解釋。

Credit: theboredengineers.com
Credit: theboredengineers.com

簡單來說,在人臉的情況下,Pitch指的是鼻尖指向相機下方或是上方。Yaw則是表示左臉或是右臉。Roll用來表示臉傾斜的角度。

Pitch、Yaw and Roll的一維邊際分布 (Marginal Distributions)

有了照片中估算的角度,我們可以用Kernel Density Estimation的方法來估計三位正妹各自的Pitch、Yaw and Roll一維的機率分布為何。結果請見下圖左側。 

-----廣告,請繼續往下閱讀-----
Julie
Julie Chang (張齊郡)
張香香
張香香
Mika (黃杏蕙)
Mika 黃杏蕙

從這些數據我們可以學到甚麼東西呢?

首先,我們可以看到三位正妹在俯仰Pitch (藍線)度的選擇上相當一致,絕大部分的自拍照都選擇將臉朝下約莫15 度左右的姿勢。這和一般人對於自拍的認知相符合,臉朝下自拍往往可以有瘦臉的效果。經由影像分析我們得到15度左右也許是最佳的結果。

第二,我們觀察到扭轉Yaw (綠線)角度上選擇有蠻大的差異。比如說,Julie Chang (張齊郡)習慣性地會將她的右臉面向相機,而張香香則是較喜歡露出她的左臉。然而,不論是傾向左臉或右臉,橫擺的角度大小通常為20度左右。也許在這樣的角度底下,可以讓自拍照片臉部特徵更加立體。至於個人左右臉哪個比較具吸引力,可能需要自己看鏡子練習一下才能得知了。

第三,三位正妹照相時橫擺Roll (紅線)的角度似乎沒有太大的變化,絕大部分的照片都在0度左右。不過還是可以從比較中還是可以觀察出些許不同。比如說Julie Chang (張齊郡)較偏愛在自拍中選擇較大的橫擺角度。

Pitch-Yaw 二維Distributions

雖然上面的一維機率分布較為簡單直覺,但是往往會過於簡化而忽略了資料中各維度相互的影響。我們在上圖右側畫出二維的分布。從中我們發現,Pitch-Yaw-Roll角度之間並不是相互獨立(Independent)或是無關(Uncorrelated)的。這驅使我們去更進一步了解正妹們究竟是如何擺姿勢。 我們用了Mean-Shift 演算法從一堆相片之中,找出機率分布中的mode。以下是Mean-Shift做分類的結果。

-----廣告,請繼續往下閱讀-----
Julie_Cluster
Julie Chang (張齊郡)
張香香
張香香
Mika 黃杏蕙
Mika 黃杏蕙

從資料中找出代表性的姿勢

有了從Mean-shift得到的Clustering,我們可以利用影像「平均」來視覺化我們找到具有代表性的自拍姿勢。下面我們對這三位正妹各選了12張代表性的自拍姿勢。

張齊郡(Julie Chang)
Julie Chang(張齊郡)
張香香
張香香
Mika 黃杏蕙
Mika 黃杏蕙

人臉姿勢的資料還可以做些甚麼呢?這裡有個簡單的應用。我們使用估計出來的角度做排序,就可以產生下面沿著不同POSE而改變的影像,也許可以方便大家觀賞正妹的照片,點選照片可連結到GIF檔圖集。

Julie Chang (張齊郡)
Julie Chang (張齊郡)
張香香
張香香
Mika 黃杏蕙
Mika 黃杏蕙

當然,從三位正妹的自拍照片我們很難去做明確的結論,希望同樣的技術可以運用在大量自拍高手的照片上,相信屆時我們將能從中發掘每種臉型最適合的自拍姿勢為何。

原文:What is the best pose for a selfie? [June 23, 2014]

-----廣告,請繼續往下閱讀-----
文章難易度
活躍星系核_96
752 篇文章 ・ 126 位粉絲
活躍星系核(active galactic nucleus, AGN)是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍,在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。 本帳號發表來自各方的投稿。附有資料出處的科學好文,都歡迎你來投稿喔。 Email: contact@pansci.asia

0

3
3

文字

分享

0
3
3
圖形處理單元與人工智慧
賴昭正_96
・2024/06/24 ・6944字 ・閱讀時間約 14 分鐘

-----廣告,請繼續往下閱讀-----

  • 作者/賴昭正|前清大化學系教授、系主任、所長;合創科學月刊

我擔心人工智慧可能會完全取代人類。如果人們能設計電腦病毒,那麼就會有人設計出能夠自我改進和複製的人工智慧。 這將是一種超越人類的新生命形式。

——史蒂芬.霍金(Stephen Hawking) 英國理論物理學家

大約在八十年前,當第一台數位計算機出現時,一些電腦科學家便一直致力於讓機器具有像人類一樣的智慧;但七十年後,還是沒有機器能夠可靠地提供人類程度的語言或影像辨識功能。誰又想到「人工智慧」(Artificial Intelligent,簡稱 AI)的能力最近十年突然起飛,在許多(所有?)領域的測試中擊敗了人類,正在改變各個領域——包括假新聞的製造與散佈——的生態。

圖形處理單元(graphic process unit,簡稱 GPU)是這場「人工智慧」革命中的最大助手。它的興起使得九年前還是個小公司的 Nvidia(英偉達)股票從每股不到 $5,上升到今天(5 月 24 日)每股超過 $1000(註一)的全世界第三大公司,其創辦人(之一)兼首席執行官、出生於台南的黃仁勳(Jenson Huang)也一躍成為全世界排名 20 內的大富豪、台灣家喻戶曉的名人!可是多少人了解圖形處理單元是什麼嗎?到底是時勢造英雄,還是英雄造時勢?

黃仁勳出席2016年台北國際電腦展
Nvidia 的崛起究竟是時勢造英雄,還是英雄造時勢?圖/wikimedia

在回答這問題之前,筆者得先聲明筆者不是學電腦的,因此在這裡所能談的只是與電腦設計細節無關的基本原理。筆者認為將原理轉成實用工具是專家的事,不是我們外行人需要了解的;但作為一位現在的知識分子或公民,了解基本原理則是必備的條件:例如了解「能量不滅定律」就可以不用仔細分析,即可判斷永動機是騙人的;又如現在可攜帶型冷氣機充斥市面上,它們不用往室外排廢熱氣,就可以提供屋內冷氣,讀者買嗎?

CPU 與 GPU

不管是大型電腦或個人電腦都需具有「中央處理單元」(central process unit,簡稱 CPU)。CPU 是電腦的「腦」,其電子電路負責處理所有軟體正確運作所需的所有任務,如算術、邏輯、控制、輸入和輸出操作等等。雖然早期的設計即可以讓一個指令同時做兩、三件不同的工作;但為了簡單化,我們在這裡所談的工作將只是執行算術和邏輯運算的工作(arithmetic and logic unit,簡稱 ALU),如將兩個數加在一起。在這一簡化的定義下,CPU 在任何一個時刻均只能執行一件工作而已。

-----廣告,請繼續往下閱讀-----

在個人電腦剛出現只能用於一般事物的處理時,CPU 均能非常勝任地完成任務。但電腦圖形和動畫的出現帶來了第一批運算密集型工作負載後,CPU 開始顯示心有餘而力不足:例如電玩動畫需要應用程式處理數以萬計的像素(pixel),每個像素都有自己的顏色、光強度、和運動等, 使得 CPU 根本沒辦法在短時間內完成這些工作。於是出現了主機板上之「顯示插卡」來支援補助 CPU。

1999 年,英偉達將其一「具有集成變換、照明、三角形設定/裁剪、和透過應用程式從模型產生二維或三維影像的單晶片處理器」(註二)定位為「世界上第一款 GPU」,「GPU」這一名詞於焉誕生。不像 CPU,GPU 可以在同一個時刻執行許多算術和邏輯運算的工作,快速地完成圖形和動畫的變化。

依序計算和平行計算

一部電腦 CPU 如何計算 7×5+6/3 呢?因每一時刻只能做一件事,所以其步驟為:

  • 計算 7×5;
  • 計算 6/3;
  • 將結果相加。

總共需要 3 個運算時間。但如果我們有兩個 CPU 呢?很多工作便可以同時(平行)進行:

-----廣告,請繼續往下閱讀-----
  • 同時計算 7×5 及 6/3;
  • 將結果相加。

只需要 2 個運算時間,比單獨的 CPU 減少了一個。這看起來好像沒節省多少時間,但如果我們有 16 對 a×b 要相加呢?單獨的 CPU 需要 31 個運算的時間(16 個 × 的運算時間及 15 個 + 的運算時間),而有 16 個小 CPU 的 GPU 則只需要 5 個運算的時間(1 個 × 的運算時間及 4 個 + 的運算時間)!

現在就讓我們來看看為什麼稱 GPU 為「圖形」處理單元。圖一左圖《我愛科學》一書擺斜了,如何將它擺正成右圖呢? 一句話:「將整個圖逆時針方向旋轉 θ 即可」。但因為左圖是由上百萬個像素點(座標 x, y)組成的,所以這句簡單的話可讓 CPU 忙得不亦樂乎了:每一點的座標都必須做如下的轉換

x’ = x cosθ + y sinθ

y’ = -x sinθ+ y cosθ

-----廣告,請繼續往下閱讀-----

即每一點均需要做四個 × 及兩個 + 的運算!如果每一運算需要 10-6 秒,那麼讓《我愛科學》一書做個簡單的角度旋轉,便需要 6 秒,這豈是電動玩具畫面變化所能接受的?

圖形處理的例子

人類的許多發明都是基於需要的關係,因此電腦硬件設計家便開始思考:這些點轉換都是獨立的,為什麼我們不讓它們同時進行(平行運算,parallel processing)呢?於是專門用來處理「圖形」的處理單元出現了——就是我們現在所知的 GPU。如果一個 GPU 可以同時處理 106 運算,那上圖的轉換只需 10-6 秒鐘!

GPU 的興起

GPU 可分成兩種:

  • 整合式圖形「卡」(integrated graphics)是內建於 CPU 中的 GPU,所以不是插卡,它與 CPU 共享系統記憶體,沒有單獨的記憶體組來儲存圖形/視訊,主要用於大部分的個人電腦及筆記型電腦上;早期英特爾(Intel)因為不讓插卡 GPU 侵蝕主機的地盤,在這方面的研發佔領先的地位,約佔 68% 的市場。
  • 獨立顯示卡(discrete graphics)有不與 CPU 共享的自己專用內存;由於與處理器晶片分離,它會消耗更多電量並產生大量熱量;然而,也正是因為有自己的記憶體來源和電源,它可以比整合式顯示卡提供更高的效能。

2007 年,英偉達發布了可以在獨立 GPU 上進行平行處理的軟體層後,科學家發現獨立 GPU 不但能夠快速處理圖形變化,在需要大量計算才能實現特定結果的任務上也非常有效,因此開啟了為計算密集型的實用題目編寫 GPU 程式的領域。如今獨立 GPU 的應用範圍已遠遠超出當初圖形處理,不但擴大到醫學影像和地震成像等之複雜圖像和影片編輯及視覺化,也應用於駕駛、導航、天氣預報、大資料庫分析、機器學習、人工智慧、加密貨幣挖礦、及分子動力學模擬(註三)等其它領域。獨立 GPU 已成為人工智慧生態系統中不可或缺的一部分,正在改變我們的生活方式及許多行業的遊戲規則。英特爾在這方面發展較遲,遠遠落在英偉達(80%)及超微半導體公司(Advance Micro Devices Inc.,19%,註四)之後,大約只有 1% 的市場。

-----廣告,請繼續往下閱讀-----
典型的CPU與GPU架構

事實上現在的中央處理單元也不再是真正的「單元」,而是如圖二可含有多個可以同時處理運算的核心(core)單元。GPU 犧牲大量快取和控制單元以獲得更多的處理核心,因此其核心功能不如 CPU 核心強大,但它們能同時高速執行大量相同的指令,在平行運算中發揮強大作用。現在電腦通常具有 2 到 64 個核心;GPU 則具有上千、甚至上萬的核心。

結論

我們一看到《我愛科學》這本書,不需要一點一點地從左上到右下慢慢掃描,即可瞬間知道它上面有書名、出版社等,也知道它擺斜了。這種「平行運作」的能力不僅限於視覺,它也延伸到其它感官和認知功能。例如筆者在清華大學授課時常犯的一個毛病是:嘴巴在講,腦筋思考已經不知往前跑了多少公里,常常為了追趕而越講越快,將不少學生拋到腦後!這不表示筆者聰明,因為研究人員發現我們的大腦具有同時處理和解釋大量感官輸入的能力。

人工智慧是一種讓電腦或機器能夠模擬人類智慧和解決問題能力的科技,因此必須如人腦一樣能同時並行地處理許多資料。學過矩陣(matrix)的讀者應該知道,如果用矩陣和向量(vector)表達,上面所談到之座標轉換將是非常簡潔的(註五)。而矩陣和向量計算正是機器學習(machine learning)演算法的基礎!也正是獨立圖形處理單元最強大的功能所在!因此我們可以了解為什麼 GPU 會成為人工智慧開發的基石:它們的架構就是充分利用並行處理,來快速執行多個操作,進行訓練電腦或機器以人腦之思考與學習的方式處理資料——稱為「深度學習」(deep learning)。

黃仁勳在 5 月 22 日的發布業績新聞上謂:「下一次工業革命已經開始了:企業界和各國正與英偉達合作,將價值數萬億美元的傳統資料中心轉變為加速運算及新型資料中心——人工智慧工廠——以生產新商品『人工智慧』。人工智慧將為每個產業帶來顯著的生產力提升,幫助企業降低成本和提高能源效率,同時擴大收入機會。」

附錄

人工智慧的實用例子:下面一段是微軟的「copilot」代書、谷歌的「translate」代譯之「one paragraph summary of GPU and AI」。讀完後,讀者是不是認為筆者該退休了?

-----廣告,請繼續往下閱讀-----

GPU(圖形處理單元)和 AI(人工智慧)之間的協同作用徹底改變了高效能運算領域。GPU 具有平行處理能力,特別適合人工智慧和機器學習所需的複雜資料密集運算。這導致了影像和視訊處理等領域的重大進步,使自動駕駛和臉部辨識等技術變得更加高效和可靠。NVIDIA 開發的平行運算平台 CUDA 進一步提高了 GPU 的效率,使開發人員能夠透過將人工智慧問題分解為更小的、可管理的、可同時處理的任務來解決這些問題。這不僅加快了人工智慧研究的步伐,而且使其更具成本效益,因為 GPU 可以在很短的時間內執行與多個 CPU 相同的任務。隨著人工智慧的不斷發展,GPU 的角色可能會變得更加不可或缺,推動各產業的創新和新的可能性。大腦透過神經元網路實現這一目標,這些神經元網路可以獨立但有凝聚力地工作,使我們能夠執行複雜的任務,例如駕駛、導航、觀察交通信號、聽音樂並同時規劃我們的路線。此外,研究表明,與非人類動物相比,人類大腦具有更多平行通路,這表明我們的神經處理具有更高的複雜性。這個複雜的系統證明了我們認知功能的卓越適應性和效率。我們可以一邊和朋友聊天一邊走在街上,一邊聽音樂一邊做飯,或一邊聽講座一邊做筆記。人工智慧是模擬人類腦神經網路的科技,因此必須能同時並行地來處理許多資料。研究人員發現了人腦通訊網路具有一個在獼猴或小鼠中未觀察獨特特徵:透過多個並行路徑傳輸訊息,因此具有令人難以置信的多任務處理能力。

註解

(註一)當讀者看到此篇文章時,其股票已一股換十股,現在每一股約在 $100 左右。

(註二)組裝或升級過個人電腦的讀者或許還記得「英偉達精視 256」(GeForce 256)插卡吧?

(註三)筆者於 1984 年離開清華大學到 IBM 時,就是參加了被認為全世界使用電腦時間最多的量子化學家、IBM「院士(fellow)」Enrico Clementi 的團隊:因為當時英偉達還未有可以在 GPU 上進行平行處理的軟體層,我們只能自己寫軟體將 8 台中型電腦(非 IBM 品牌!)與一大型電腦連接來做平行運算,進行分子動力學模擬等的科學研究。如果晚生 30 年或許就不會那麼辛苦了?

-----廣告,請繼續往下閱讀-----

(註四)補助個人電腦用的 GPU 品牌到 2000 年時只剩下兩大主導廠商:英偉達及 ATI(Array Technology Inc.)。後者是出生於香港之四位中國人於 1985 年在加拿大安大略省成立,2006 年被超微半導體公司收購,品牌於 2010 年被淘汰。超微半導體公司於 2014 年 10 月提升台南出生之蘇姿豐(Lisa Tzwu-Fang Su)博士為執行長後,股票從每股 $4 左右,上升到今天每股超過 $160,其市值已經是英特爾的兩倍,完全擺脫了在後者陰影下求生存的小眾玩家角色,正在挑戰英偉達的 GPU 市場。順便一題:超微半導體公司現任總裁(兼 AI 策略負責人)為出生於台北的彭明博(Victor Peng);與黃仁勳及蘇姿豐一樣,也是小時候就隨父母親移居到美國。

(註五)

延伸閱讀

  • 熱力學與能源利用」,《科學月刊》,1982 年 3 月號;收集於《我愛科學》(華騰文化有限公司,2017 年 12 月出版),轉載於「嘉義市政府全球資訊網」。
  • 網路安全技術與比特幣」,《科學月刊》,2020 年 11 月號;轉載於「善科教育基金會」的《科技大補帖》專欄。
文章難易度

討論功能關閉中。

賴昭正_96
43 篇文章 ・ 56 位粉絲
成功大學化學工程系學士,芝加哥大學化學物理博士。在芝大時與一群留學生合創「科學月刊」。一直想回國貢獻所學,因此畢業後不久即回清大化學系任教。自認平易近人,但教學嚴謹,因此穫有「賴大刀」之惡名!於1982年時當選爲 清大化學系新一代的年青首任系主任兼所長;但壯志難酬,兩年後即辭職到美留浪。晚期曾回台蓋工廠及創業,均應「水土不服」而鎩羽而歸。正式退休後,除了開始又爲科學月刊寫文章外,全職帶小孫女(半歲起);現已成七歲之小孫女的BFF(2015)。首先接觸到泛科學是因爲科學月刊將我的一篇文章「愛因斯坦的最大的錯誤一宇宙論常數」推薦到泛科學重登。

1

0
1

文字

分享

1
0
1
「黃金」角度——長腿背後的秘密,原來網美和服飾店的是這樣辦到的?!|2021 數感盃|高中專題|金獎
數感實驗室_96
・2021/12/25 ・5320字 ・閱讀時間約 11 分鐘

-----廣告,請繼續往下閱讀-----

  • 作者:王浤齡、陳玟蓉、高珮珊/台北市立大同高級中學

數感盃青少年寫作競賽」提供國中、高中職學生在培養數學素養後,一個絕佳的發揮舞台。本競賽鼓勵學生跨領域學習,運用數學知識,培養及展現邏輯思考與文字撰寫的能力,盼提升臺灣青少年科普寫作的風氣以及對數學的興趣。
本文為 2021 數感盃青少年寫作競賽/高中組專題報導類佳作之作品,為盡量完整呈現學生之作品樣貌,本文除首圖及標點符號、錯字之外並未進行其他大幅度編修。

在拍照時,我們總是希望能夠自然地呈現出最漂亮的自己,但這是一件何其困難的事情。法國傳奇攝影師——羅伯特・杜瓦諾曾說:「如果我知道如何拍出好照片,那我每次都會拍出好照片了。」然而有沒有什麼拍攝方法,可以讓照片中的身材比例變得更完美呢? 

有一天,我和一群朋友到某間知名服飾店逛街,試穿今年流行的秋冬款,並拍照片比較看看,選出較適合自己的衣服。在過程中,我發現一個問題:「為什麼在店家試穿時,全身鏡映照出的自己總是比照片中好看?」

嘗試幾次後,我們發現這是因為自己的身材比例,在鏡子與照片中的呈現是不一樣的,服飾店內的全身鏡,總是使腿的比例看起來比較長。

圖/envato elements

於是我們開始好奇,拍照時要如何拍攝出如同店裡的全身鏡具有長腿效果的方法,以及,是什麼原因讓這間服飾店內的全身鏡會有這樣長腿的效果呢? 

-----廣告,請繼續往下閱讀-----

上網搜尋之後,發現在這個社群軟體發達的時代,網路上有許多人分享不用俢圖軟體,就能「拍」出完美比例的文章或是教學影片,其結論是:「把手機或相機傾斜一個角度,就可以讓人的腿在照片中的比例變長。」然而,所謂的「傾斜一個角度」到底是幾度,卻沒有網站提供。

事實上,每個人身高比例皆不相同,取景的遠近都不一樣,甚至使用的拍攝器材也不 盡相同,使這個「角度」也會因情況而有所不同。因此,我們試著用所學的數學工具,去推論出不同人在拍照時,手機應該要傾斜幾度才能達到想要的長腿效果? 

關於服飾店內全身鏡有長腿效果的原因,我在觀察這些鏡子後,發現它們都有傾斜(如圖一),而且與地面都是夾 80 度。這個傾斜角度到底有什麼樣的用意呢?我們試圖去解開這個業界沒有說出來的秘密。 

首先,我們先解釋物理上的「成像原理」。人的眼睛之所以能看到物體、相機可以拍到畫面,都是因為物體反射的光線,進入到眼睛內的視網膜、或是相機裡的底片後所成的「像」。

-----廣告,請繼續往下閱讀-----

成像的原理與國中理化所教的凸透鏡成像原理相同,是由三條光線所交會而成的像(圖二),其中平行光通過透鏡後會穿過焦點,而穿過焦點的光通過透鏡後會成為平行光,交會處就是成像地點;並且第三條穿過透鏡的直線光也會與前兩條相交,因此可以由物距與像距算出成像縮放的倍率。 

如果我們在成像位置放一個平面,當成像的平面與物體是平行時,像會與實物相似,但是上下顛倒;但是如果把成像平面傾斜一個角度的話,成像的比例就會因為傾斜的角度,而 與實物的原比例不同。 

我們想要研究相機傾斜角度對照片中人物的身材比例的影響。 

考慮拍攝時,相機高度與被拍攝者的肚臍位置相同,如上面圖三所示,點 D 為相機的焦點,物體反射的光線直線穿過 D點,在另一側的平面上呈現一個倒立的像。

-----廣告,請繼續往下閱讀-----

把 \( \overline{AC} \) 當成為一位站立著的被拍攝者, \( \overline{AB} \) =b 為被拍攝者的頭頂到肚臍的長度,即為身長;而 \( \overline{BC} \) =l 為被拍攝者的肚臍到腳底的長度,即為腿長; \( \overline{BD} \) =d 為被拍攝者與相機的距離。

當成像平面垂直地面時,若把像距等比例放大到等於物距時(即是 \( \overline{DI} \) =d ),則 \( \overline{HJ} \) 會是一個全等的倒立像,即 \( \overline{HI} \) =l 為像的腿長、 \( \overline{IJ} \) =b 為像的身長。

若把成像平面傾斜一個角度,轉成 \( \overline{EJ} \) , 則像的身長會被拉成 \( \overline{IJ} \) → \( \overline{FJ} \)  ,像的腿長會被拉成 \( \overline{IH} \) → \( \overline{FE} \) 。

接下來,我們將推導出一條公式,可以算出相機該傾斜幾度,才能讓被拍攝者的身長及腿長呈現我們所想要的比例。 

-----廣告,請繼續往下閱讀-----
圖四

假設在照片中,身長比腿長的比例為 \( \overline{FJ} \) : \( \overline{EF} \) =1 : r,先求出 \( \overline{HD} \) : \( \overline{HE} \) 。

如圖四,我們利用「孟氏定理」, ΔJEH 被直線 \( \overline{FD} \) 所截的線段比為

 \( \frac{\overline{JI}}{\overline{IH}} \) ✕ \( \frac{\overline{HD}}{\overline{DE}} \) ✕ \( \frac{\overline{EF}}{\overline{FJ}} \) =1  \( \Rightarrow \) \( \frac{b}{l} \) ✕ \( \frac{\overline{HD}}{\overline{DE}} \) ✕ \( \frac{r}{1} \) =1,則 \( \frac{\overline{HD}}{\overline{DE}} \) = \( \frac{l}{br} \)

又因為圖三中, \( \overline{IH} \) // \( \overline{EG} \) ,所以 \( \frac{l}{br} \) = \( \frac{\overline{HD}}{\overline{DE}} \) =  \( \frac{\overline{DI}}{\overline{DG}} \) = \( \frac{d}{\overline{DG}} \)  \( \Rightarrow \)  \( \overline{DG} \) = \( \frac{bdr}{l} \)

-----廣告,請繼續往下閱讀-----

\( \overline{IG} \) = \( \overline{DG} \) – \( \overline{DI} \) = \( \frac{bdr}{l} \) -d

因為 ΔEFG ≈ ΔJFI,所以  \( \frac{\overline{IF}}{\overline{FG}} \) =  \( \frac{\overline{FJ}}{\overline{EF}} \) =  \( \frac{1}{r} \) ;可推得:

\( \overline{IF} \) = \( \frac{1}{(1+r)} \) ✕ \( \overline{IG} \) = \( \frac{1}{(1+r)} \) ✕  \( \left ( \frac{bdr}{l}-d \right ) \)

因此,若相機傾斜的斜率為 m,則

-----廣告,請繼續往下閱讀-----

 \( m=\frac{\overline{IJ}}{\overline{IF}}=\frac{b}{\frac{1}{(1+r)}\left ( \frac{bdr}{l}-d \right )}=\frac{(1+r)lb}{rbd-ld} \)

從這個公式可知,我們只要知道以下數據,代入公式之中即可算出相機的斜率:

若圖中 \( \overline{AJ} \) 的斜率與 \( \overline{CH} \) (原文使用的是雙箭頭線段符號,但公式表中找不到,所以就先以線段符號代替)的斜率分別令成 mb ml ,則相機傾斜的斜率公式可用斜率簡化表示為

 \( m=\frac{(1+r)m_{b}m_{l}}{rm_{b}+m_{l}} \)

我們根據此公式進行以下實作。 

拍攝工具為 iPhone 手機,被拍攝同學的身體數據如下表一: 

-----廣告,請繼續往下閱讀-----

我們設定畫面高度與人物身高的比例黃金比例(約為 1:0.618),而由〈物距計算器〉網站,可算出此畫面下的拍攝距離為 144.7 公分。並且,我們希望拍攝出的身長與腿長也是黃金比 例,即  \( r=\frac{1}{0.618}=1.618 \)。

由表一,因為 mb = -身高 / 物距 =  \( \frac{-67.5}{144.7} \),ml = 腿長 / 物距 =  \( \frac{95.5}{144.7} \),所以帶入公式可得:

\( m=\frac{(1+1.618)\times \left ( \frac{-67.5}{144.7} \right )\times \left ( \frac{95.5}{144.7} \right )}{1.618\times \left ( \frac{-67.5}{144.7} \right )+\left ( \frac{95.5}{144.7} \right )}\approx 8.538 \)

因此,拍攝時手機傾斜的斜率約為 8.538,換算成角度: 

\( 8.538=tan\theta \Rightarrow tan^{-1}(8.538)\approx 83.3^{\circ} \)

所以手機在拍攝這位同學時應該要傾斜 83.3°。

下圖是手機傾斜前後拍照出來的照片效果對比: 

從右圖看得出來,照片中的腿部確實有拉長的效果,其比例為 1 : 1.84,但並非是當初我們給 定的黃金比例。這個原因是來自於 iPhone 手機鏡頭視角的限制,當手機傾斜時,放在腰部的高度,被拍者會無法全身入鏡。所以,我們將手機高度降低至能夠完全拍攝到整個人,因而導致加大拉長效果。

因此,我們建議在拍攝時,若需要降低手機高度,則手機與地面夾角,要比原計算出來的角度更接近 90° 一點。 

接下來,我們利用研究的結果去計算,各個年齡層與性別的人在拍照時,身長與腿長在照片中要呈現黃金比例,手機適當的傾斜角度分別為幾度。

下圖五,是內政部〈建築使用行為與本土人因工程關連性研究〉指出的 19 項人體計測尺寸中的部份數據;而下圖六,則是將圖表的數據進行以下的計算,去推論一般人平均的身長與腿長。

  • 膝蓋高度 − 膝膕高度 = 大腿厚度 
  • 坐高 − 大腿厚度 = 身長(頭頂到肚臍) 
  • 身高 − 身長 = 腿長 

把各個年齡層與性別的平均身長與腿長整理成下表二。最後,我們各別將數據代入公式計算得出,不同人在拍照時,手機的傾斜角度,如下表三所示。 

表格三中,65 歲以上的民眾要拍出黃金比例的手機角度比較垂直,是因為數據的統計有將駝背也考慮進去,導致統計出的結果,相對其它年齡層來說腿的比例較長。但普遍來說, 在未滿 65 歲的各個年齡層拍照時,手機傾斜角度分布在 65 ~ 70° 之間。

然而,考慮到手機傾斜時又要全身入鏡,需要降低手機拍攝的高度,會更加拉大腿長的比例,因此,一般人在拍照時,若想讓身長比腿長接近黃金比例的話,我們建議:

手機與地面的夾角以「70°」為最佳。

服飾業內不能說的秘密,全身鏡傾斜 80° 的原因!

在前文中,我們想探討第二個問題,是服飾店的全身鏡為什麼都與地面夾 80°。其斜置的原因,明顯是要讓腿看起比較長,但為何不用其它的角度而恰好是 80° 呢? 

斜鏡面會產生仰視效果,讓人感覺鏡中的人像向後仰,使腿的視覺效果變長。事實上, 長腿效果與我們研究的主題一致,同樣是實物(鏡中後仰的人像)與成像平面(視網膜)不平行,因此後仰角度與視覺比例的關係,符合前文推論的公式。

如下圖七所示,全身鏡傾斜 80° 後,由於鏡子和直立的人夾角 為 10°,因為鏡射原理,鏡子和像的夾角也為為10°, 所以像會傾斜 70°,且 ∠ACD = ∠AOB = 10° 。

實際到店家測量全身鏡前的走道寬度,約為 78 公分。也就是一般民眾會站在距離約 78 公分的位置使用全身鏡,即 \( \overline{DE} \) = 78,則 

78+ \( \overline{EC} \) = \( \overline{DC} \) = \( \overline{AC} \) cos(10º)

 \( \Rightarrow \) 78+ \( \overline{EC} \) = 2 \( \overline{BC} \) cos(10º)

 \( \Rightarrow \) 78+ \( \overline{EC} \) = 2 \( \overline{EC} \) cos(10º)

因此,可以算出 \( \overline{EC}=\frac{78}{2cos^{2}(10^{\circ})-1}\approx 83 \)

所以當我們照鏡子時,眼睛與成像的距離為 78+83=161 公分。若成年女性(平均身長 75.6 公分、 腿長 81.8 公分)使用服飾店的全身鏡時,看到鏡中自己的比例(腿長 / 身長)為 r,則

 \( \frac{(1+r)\times \left ( -\frac{75.6}{161} \right )\times \left ( \frac{81.8}{161} \right )}{r\times \left ( -\frac{75.6}{161} \right )+\left ( \frac{81.8}{161} \right )}=tan(70^{\circ})\approx 2.747 \)

 \( \Rightarrow \) r ✕ [(-0.4696) ✕ 0.5081+2.747 ✕ 0.4696] = 0.4696 ✕ 0.5081 + 2.747 ✕ 0.5081

 \( \Rightarrow r=\frac{0.4696\times 0.5081 + 2.747\times 0.5081}{ [(-0.4696)\times 0.5081+2.747\times 0.4696] }=\frac{1.63435446}{1.0.5138744}\approx 1.565 \)

這個結果非常接近黃金比例。

用其它年齡層與性別的數據去計算,也可得到 r ≈ 1.618 ± 0.05

因此,我們發現服飾店會在店內全身鏡會斜置 80° 的原因,很可能是因為要讓顧客認為穿上自家的衣服後,會讓比例接近於黃金比例,以提升購買慾望。

結合我們計算的數據和實作的結果,可以得出一些結論:大多數的人拍攝時,如果想要拍出身體的比例接近黃金比例,手機需要傾斜的角度大約為 65° ~ 70°。若將傾斜時,可能會把手機高度降低的因素考慮進去,則是以 70° 為最佳角度。

下次拍照時,不妨也將手機傾斜成 70°,或許會有意想不到的效果!

參考資料

所有討論 1
數感實驗室_96
76 篇文章 ・ 49 位粉絲
數感實驗室的宗旨是讓社會大眾「看見數學」。 數感實驗室於 2016 年 4 月成立 Facebook 粉絲頁,迄今超過 44,000 位粉絲追蹤。每天發布一則數學文章,內容包括介紹數學新知、生活中的數學應用、或是數學和文學、藝術等跨領域結合的議題。 詳見網站:http://numeracy.club/ 粉絲專頁:https://www.facebook.com/pg/numeracylab/

2

9
1

文字

分享

2
9
1
「腦海中的自我」與真實的你差很大?——心像準確度與「自尊狀態」高度相關
Bonnie_96
・2021/12/09 ・2008字 ・閱讀時間約 4 分鐘

「回想一下你昨天晚餐吃了些什麼?」此時,你的腦海是不是開始浮現各種餐點的圖像,像是大阪燒、泡麵等等。而這就是心理學當中的「心像」(Mental Image)概念。但是如果問大家說,「回想你長什麼樣」,你出現的畫面會是什麼呢?這也成為研究者超好奇的事。

以前我們都曾在課堂中畫自畫像,看看旁邊繪畫技巧超厲害的同學,畫得有夠像。但再看看自己手中那張,內心只會驚恐地想說:這到底是誰?!

事實上,畫在紙上的自畫像,完全取決於個人的繪畫技巧。但是出現在我們腦海中的,基本上就可以忽略有沒有高超繪畫技巧的因素,而是與我們對自我的「心像」構成有關。

圖/Pexels

其實你的「心像自拍」,跟你只有 87 分像……

於是實驗開始!修但幾勒,你一定會問說,我腦中浮現的畫面,是要怎麼「實體」呈現出來?

-----廣告,請繼續往下閱讀-----

英國班戈大學(Bangor University)和倫敦大學( University of London)的心理學家就開發了一種方法,能夠簡單地讓你把腦海中的「自畫像」(或是自拍)形象化。

他們隨機給參與者兩張不同人臉,讓你選出「最接近自己長相」的那張。就在這不斷重複「人臉二選一」數百次後。實驗者就會將參與者選出所有「最接近自己長相」的照片全部綜合、平均起來,就變成每個人腦海中獨特的「自拍」。

照理來說,如果參與者都選出「最接近自己長相」的照片,那麼最終出現的那張會趨近「我們真實的長相」,對吧?!

但是,結果告訴我們只有87分像啊……因為最後呈現的照片,是會選出一張和自己長得不太一樣的人臉。

-----廣告,請繼續往下閱讀-----

對自我的看法,會強烈影響心中的自我形象

所以,為什麼我們腦海中的自畫像,會和真實的自己長得不一樣呢?其實,這和我們內心如何看待自己、覺得自己是什麼樣的人,有很大的關係。

在讓參與者不斷經歷「人臉二選一」的實驗後,實驗者讓他們都填寫人格特質和自尊相關的問卷,來了解在他們心中自己是什麼樣子的人。結果,非常有趣地是,「你覺得自己是什麼樣的人,會影響你如何想像自己的外表!」

在數據收集的初級階段,每個參與者的臉都被拍成了護照式的照片。(a)在髮際線周圍裁剪,去除無關的特徵。 (b)參與者在隨機產生的面孔之間進行選擇,以創建他們覺得看起來像自己的「自畫像」面孔。 隨後填寫問卷。(c)測量他們的人格特質(BFI-10)和自尊狀態(SSES)。在數據收集的第二階段,向 112 位評估者展示參與者的真實面孔和 「自畫像」面孔 。(d)評估者使用 BFI-10 來評估他們對兩張臉的每個個性特徵的感知程度。 參考資料

研究發現,參與者對自己的看法和信念,會強烈地影響他們如何對自己的外表想像。也就是說,如果參與者認為自己是一個外向的人,那麼他們在腦中浮現自己的臉,會比在其他人面前看起來更自信和善於社交。

你一定也聽過,不管是面試或是約會等,千萬記得一定要留下好的「第一印象」。而這和心理學中的初始效應(primacy effect)有關。因為在一開始所得到的資訊,往往會比後來得到的有更大的影響。

-----廣告,請繼續往下閱讀-----

身為論文作者之一馬諾斯‧察基里斯(Manos Tsakiris)就解釋,「當我們看到一張新的臉時,其實在不到幾秒的時間,我們就已經根據我們所接收到的資訊,形成對某個人的印象。」

重點來了,不論對方所形成的第一印象是否正確,它都會影響我們對別人的看法。而同樣地,這件事情也反映在這項實驗中,因為我們對自己的印象,會影響我們在腦海中是如何看待自己的。

臉只有 87 分像……那身材呢?

如果說想像和真實的自己,長得不一樣。那我們對自己想像中的身材,也會有落差嗎?

在另個實驗中,繼續利用「身材二選一」的方式,最後會形成一張你所有「最接近自己身材」的照片全部綜合、平均起來。結果,這張在參與者腦海中「想像的身材」還是明顯長得不一樣啊……。

-----廣告,請繼續往下閱讀-----

同樣,參與者對自己身材的態度和信念,會強烈地影響我們對於身材的想像。值得注意的是,對自己的外表或身材,有負面情緒或態度的人,傾向會覺得自己的身材比真實的自己要胖很多。

我們對於自己的外貌和身材的想像,大多時候和「真實的自己」其實會有落差。而會造成差距的因素,就是和我們的內心怎麼看待自己有很大的關係。

而實驗者也提到,希望這項研究未來能夠幫助到身體畸形恐懼症(body dysmorphic disorder, 主要指患者會過度關注自己的身材和外表等缺陷,並過度誇張的臆想、甚至出現強迫行為等)等臨床中的評估。

圖/GIPHY

參考資料

  • Maister, L., De Beukelaer, S., Longo, M. R., & Tsakiris, M. (2021). The Self in the Mind’s Eye: Revealing How We Truly See Ourselves Through Reverse Correlation. Psychological Science. https://doi.org/10.1177/09567976211018618
所有討論 2
Bonnie_96
21 篇文章 ・ 33 位粉絲
喜歡以科普的方式,帶大家認識心理學,原來醬子可愛。歡迎來信✉️ lin.bonny@gmail.com

0

0
1

文字

分享

0
0
1
正妹的祕密-自拍角度剖析
活躍星系核_96
・2014/07/10 ・2259字 ・閱讀時間約 4 分鐘 ・SR值 516 ・六年級

-----廣告,請繼續往下閱讀-----

文 / Jia-Bin Huang|伊利諾大學香檳分校電機工程學系博士候選人

大家都愛自拍,但為什麼有些人自拍出來的照片總是特別地好看?很明顯地自拍時相機與臉之間的相對角度佔了絕大部分的因素。打開網路搜尋,很快地就可以搜尋到非常多相關的擺姿勢技巧教學:

然而這些教學往往太過於抽象而不容易簡單地運用在日常生活中。我們心中不免疑惑,究竟要怎麼樣擺姿勢才是最好看的呢?不同於專家的意見,我們直接試著從資料中找出規律來。我們這裡選了三位網路正妹來做分析:

選擇這三位有兩個主要的原因:第一、她們在臉書上都擁有高人氣,表示大家都相當喜歡他們的狀態更新。第二、我們需要大量的資料進行分析以免得到不可靠的數據,三位正妹在臉書上千張公開自拍照片即成了有用的資料。

-----廣告,請繼續往下閱讀-----

資料處理

要分析正妹們自拍時如何擺POSE,我們得先從影像中估算臉與相機間的相對角度。大致上可以分為三個步驟:

  1. 首先用現成的軟體批次下載正妹們在facebook上公開的照片。
  2. 其次我們用Open CV中的人臉偵測軟體來自動地標示每張照片裡臉部的位置。
  3. 有了臉部的偵測,我們接著運用電腦視覺的技術來估算臉部3D的Pose。

在這裡我們使用空氣動力學中的俯仰(Pitch)、 扭轉(Yaw) 和橫擺(Roll)來表示物體(正妹)與觀測者(相機)間的相對角度。下圖我們借用飛機來解釋。

Credit: theboredengineers.com
Credit: theboredengineers.com

簡單來說,在人臉的情況下,Pitch指的是鼻尖指向相機下方或是上方。Yaw則是表示左臉或是右臉。Roll用來表示臉傾斜的角度。

-----廣告,請繼續往下閱讀-----

Pitch、Yaw and Roll的一維邊際分布 (Marginal Distributions)

有了照片中估算的角度,我們可以用Kernel Density Estimation的方法來估計三位正妹各自的Pitch、Yaw and Roll一維的機率分布為何。結果請見下圖左側。 

Julie
Julie Chang (張齊郡)

張香香
張香香

Mika (黃杏蕙)
Mika 黃杏蕙

-----廣告,請繼續往下閱讀-----

從這些數據我們可以學到甚麼東西呢?

首先,我們可以看到三位正妹在俯仰Pitch (藍線)度的選擇上相當一致,絕大部分的自拍照都選擇將臉朝下約莫15 度左右的姿勢。這和一般人對於自拍的認知相符合,臉朝下自拍往往可以有瘦臉的效果。經由影像分析我們得到15度左右也許是最佳的結果。

第二,我們觀察到扭轉Yaw (綠線)角度上選擇有蠻大的差異。比如說,Julie Chang (張齊郡)習慣性地會將她的右臉面向相機,而張香香則是較喜歡露出她的左臉。然而,不論是傾向左臉或右臉,橫擺的角度大小通常為20度左右。也許在這樣的角度底下,可以讓自拍照片臉部特徵更加立體。至於個人左右臉哪個比較具吸引力,可能需要自己看鏡子練習一下才能得知了。

第三,三位正妹照相時橫擺Roll (紅線)的角度似乎沒有太大的變化,絕大部分的照片都在0度左右。不過還是可以從比較中還是可以觀察出些許不同。比如說Julie Chang (張齊郡)較偏愛在自拍中選擇較大的橫擺角度。

Pitch-Yaw 二維Distributions

雖然上面的一維機率分布較為簡單直覺,但是往往會過於簡化而忽略了資料中各維度相互的影響。我們在上圖右側畫出二維的分布。從中我們發現,Pitch-Yaw-Roll角度之間並不是相互獨立(Independent)或是無關(Uncorrelated)的。這驅使我們去更進一步了解正妹們究竟是如何擺姿勢。 我們用了Mean-Shift 演算法從一堆相片之中,找出機率分布中的mode。以下是Mean-Shift做分類的結果。

-----廣告,請繼續往下閱讀-----

Julie_Cluster
Julie Chang (張齊郡)

張香香
張香香

Mika 黃杏蕙
Mika 黃杏蕙

從資料中找出代表性的姿勢

有了從Mean-shift得到的Clustering,我們可以利用影像「平均」來視覺化我們找到具有代表性的自拍姿勢。下面我們對這三位正妹各選了12張代表性的自拍姿勢。

張齊郡(Julie Chang)
Julie Chang(張齊郡)

-----廣告,請繼續往下閱讀-----

張香香
張香香

Mika 黃杏蕙
Mika 黃杏蕙

人臉姿勢的資料還可以做些甚麼呢?這裡有個簡單的應用。我們使用估計出來的角度做排序,就可以產生下面沿著不同POSE而改變的影像,也許可以方便大家觀賞正妹的照片,點選照片可連結到GIF檔圖集。

Julie Chang (張齊郡)
Julie Chang (張齊郡)

-----廣告,請繼續往下閱讀-----

張香香
張香香

Mika 黃杏蕙
Mika 黃杏蕙

當然,從三位正妹的自拍照片我們很難去做明確的結論,希望同樣的技術可以運用在大量自拍高手的照片上,相信屆時我們將能從中發掘每種臉型最適合的自拍姿勢為何。

原文:What is the best pose for a selfie? [June 23, 2014]

-----廣告,請繼續往下閱讀-----
文章難易度
活躍星系核_96
752 篇文章 ・ 126 位粉絲
活躍星系核(active galactic nucleus, AGN)是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍,在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。 本帳號發表來自各方的投稿。附有資料出處的科學好文,都歡迎你來投稿喔。 Email: contact@pansci.asia