前兩天參加同學聚會,大家問我最近在做什么工作。我一說我在做廣告算法的工作,大家立馬贊嘆了起來:“廣告算法?這聽起來就很高大上呀。”“算法工程師?聽說搞算法的掙的都很多,真是羨慕。”有些同學對我的工作比較好奇,問我:“你們平常都做些什么工作?和廣告模型相關嗎?”
看來大家對廣告算法工程師還真的是存在一些誤解。外行人覺得,廣告算法工程師每天都在和各種各樣的模型、算法打交道,實際上則不然。在廣告算法這個行業里,數據往往才是最重要的,其次是特征,最后才能輪得到算法。
在實際的工作中,如果廣告算法工程師只精通做模型,是很難取得好的工作效果的。
廣告算法工程師的真實日常是怎樣的?
比如一個擅長做模型的工程師,不停地做模型優化,不停地做調參,把所有的參數能試的都試一遍,什么學習率、優化器、batch_size等等。最后卻發現,auc曲線沒有上升反而下降了。再比如一個擅長做特征的工程師,不會在模型上下很多功夫,會對特征做更多的處理,比如為了增加模型的泛化性而添加一些統計類特征。最后發現,auc曲線出現了一些上升的趨勢,ctr(點擊通過率)也表現出上升的趨勢。這就算是取得一個不錯的工作成果。
那擅長數據的廣告算法工程師會怎么做呢?他會選擇在數據方面做一些改進,比如刪除一些沒有回傳轉化價值的廣告主數據,或者優化廣告主回傳轉化數據的方式方法等等。這樣的方法往往會取得很好的工作成果,不論是auc曲線還是ctr,都可以看到大幅的上升。
所以,廣告算法工程師更多的是處理數據與特征,最后才會考慮算法和模型。這才是最真實的廣告算法工程師的工作日常。這也是為什么,有些人戲謔稱我們為“數據庫工程師”,說我們每天都是在跟數據打交道。
廣告算法工程師的真實日常是怎樣的?
除了跟數據打交道,我們還需要根據銷售部門反饋回來的各種案例,對轉化率模型進行修改和優化。銷售部門經常反饋回來一堆問題:為什么這個賬戶實際跑量遠遠低于前期預估值,為什么這個賬戶超出成本預算那么多,等等。定位案例原因,也是我們經常做的事情。
這就是廣告算法工程師的真實日常,并沒有大家想象之中的那么高大上,那么遙不可及。