當前位置:首頁 » 操作系統 » 數分和演算法

數分和演算法

發布時間: 2023-01-02 04:16:35

A. 【數分面試寶典】數分面試常考業務題(三)

EDA(Exploratory Data Analysis)即數據探索性分析,需要對數據集中的變數進行統計和分布描述、了解變數間的相互關系,從整體上了解數據集的數據特徵。探索性分析要對調查總體所有變數的有關數據進行統計性描述,主要包括數據的頻數分析、集中趨勢分析、離散程度分析、分布以及一些基本的統計圖形。

①數據的頻數分析。在數據的預處理部分,利用頻數分析和交叉頻數分析可以檢驗異常值

②數據的集中趨勢分析。用來反映數據的一般水平,常用的指標有平均值、中位數和眾數等。

③數據的離散程度分析。主要是用來反映數據之間的差異程度,常用的指標有方差和標准差。

④數據的分布。在統計分析中,通常要假設樣本所屬總體的分布屬於正態分布,因此需要用偏度和峰度兩個指標來檢查樣本數據是否符合正態分布。

⑤數據的相關性分析。探索不同變數之間的相關性,可以使用相關性圖進行展示,表示各變數之間的相關程度,為後續機器學習的特徵選擇提供依據。

環比:與相連續的上一個統計周期進行對比,環比增長速度=(本期數-上期數)÷上期數×100% ,反映本期比上期增長了多少,如2021年12月和2021年11月對比,環比的好處是可以更直觀的表明階段性的變換,但是會受季節性因素影響。

同比:是對去年同期的一個統計階段進行對比,同比增長率=(本期數-同期數)÷同期數×100%,如今年的這個月和去年的這個月,同比的好處是可以排除一部分季節因素。

相關性的前提是各個變數之間是相互獨立的,業務上來說,每個指標之間是沒有影響的,相關性系數:0.5以下相關性較弱,0.5 -0.8中度相關,大於0.8較強相關。

如果A和B相關,會有以下幾個推論:

A導致B:充分條件

B導致A:必要條件

C導致A和B:A和B同源

A和B如果有因果:充分且必要條件

相關和因果的區別:

相關:兩個變數或多個變數之間的相互影響程度;核心點:變數與變數之間互為相關,沒有先後順序;

因果: 前一個事件對後一個事件的作用的關系及強度,核心點:有嚴格的先後順序(變化可能會有延遲),如蝴蝶效應。

好玩的題目:

Y=0.5X  y和x是相關還是因果?

y=0.5X+0.5z  y和x是相關還是因果?

答案:都是相關

因果的前提是:有一個東西是先發生,而相關是沒有先後順序的,所以上述2個都是相關,而不是因果。

Q4、什麼是聚類?業務應用場景?常見演算法

定義:

將相似的對象,將對象的特徵進行抽象,通過演算法將特徵相似的對象化為一類,是一種無監督機器學習演算法。

考點1:對於聚類,如何確定分類的數量N;

考點2:如何選擇進行聚類的特徵,比如要區分男女,有喉結的就是男生,留長發的就是女生;

應用場景:

個性化推薦(電商):相似用戶行為相似,會分到某個類,如用戶分層;

用戶畫像:基於用戶的購買偏好、消費能力進行用戶畫像;

常見演算法:

Kmeans聚類

DBSCAN聚類

Q5、什麼是分類?業務應用場景?常見演算法?

定義:

學習已有分類樣本的特徵,對新數據進行劃分,是一種有監督的機器學習演算法,分類是明確的,是有歷史樣本可學習的。

應用場景:

互聯網金融用戶信用等級分類

垃圾郵件分類

常見演算法:

邏輯回歸

SVM

貝葉斯

決策樹

KNN

XGboost

Q6、什麼是回歸?業務應用場景?常見回歸演算法?

定義:

兩個或多個變數之間是否相關,相關強度,並建立數學模型,定量評估

人話:我和你有沒有關系,什麼關系,深到什麼程度。

本質:找到一條之間最合適的平均線,讓線的附近的點分布均勻

應用場景:

運營推廣中,是不是花的錢越多,買的流量越大,品類越豐富,用戶活躍越高,那麼,多到什麼程度、大到什麼程度、豐富到什麼程度、用戶的活躍最高,留存最高;

智慧城市的交通,預測交通擁塞程度:自變數:時間段、商業指數、住宅指數、城區指數、道路指數,因變數:兩個連續信號燈之間道路的通行時間。

常見回歸演算法:

線性回歸

lasso回歸

ridge回歸

樹回歸

Q7、時間序列預測的原理是什麼?有哪些應用場景?

原理:

當自變數是時間時,且數據在時間上呈現出一定的規律,那麼這種情況一般都可以使用時間序列預測接下來一段時間的數據走勢。這個規律表現為:數據整體變化的趨勢(可以理解為一條表徵趨勢的直線)、季節性(可以理解為按照一定的周期重復出現的模式)和隨機性(可以理解為在零附近毫無規律的白雜訊)組成,時間序列就是將數據按照這三個部分分別拆解,再基於歷史數據進行組合預測。

應用場景:

一般應用於年度的KPI預測,產品的活躍用戶數趨勢,羽絨服的銷量等。

Q8、時間序列預測需要注意的點?和回歸有何區別?

需要注意的點:

時間間隔是固定的;

最近的數據對於預測影響程度越大;

預測是有季節性的,這里的季節性不一定是春夏秋冬,凡是以一定周期重復出現的都可以稱為有季節性;

回歸預測和時間序列預測的區別:

回歸是自變數對於因變數的趨勢,用以表徵自變數和因變數之間的定量關系,一般來說自變數和因變數只能是連續的數據;

時間序列預測的自變數可以是任何數據,包括時間,只要數據呈現出周期性的趨勢;

回歸不能做季節性的預測;

以上就是【數分面試寶典】系列—面試業務題系列第3篇文章的內容,部分歷史文章請回翻公眾號,更多數據分析面試筆試的文章持續更新中,敬請期待,如果覺得不錯,也歡迎分享、點贊和點在看哈

B. 算術和演算法的區別

演算法是指完成一個任務准確而完整的描述。也就是說給定初始狀態或輸入數據,經過計算機程序的有限次運算,能夠得出所要求或期望的終止狀態或輸出數據。

「算術」這個詞,在我國古代是全部數學的統稱。至於幾何、代數等許多數學分支學科的名稱,都是後來很晚的時候才有的。

國外系統地整理前人數學知識的書,要算是希臘的歐幾里得的《幾何原本》最早。《幾何原本》全書共十五卷,後兩卷時候人增補的。全書大部分是屬於幾何知識,在第七、八、九卷中專門討論了數的性質和運算,屬於算術的內容。

現在拉丁文的「算術」這個詞是由希臘文的「數和數(音屬,shû三音)數的技術」變化而來的。「算」字在中國的古意也是「數」的意思,表示計算用的竹籌。中國古代的復雜數字計算都要用算籌。所以「算術」包含當時的全部數學知識與計算技能,流傳下來的最古老的《九章算術》以及失傳的許商《算術》和杜忠《算術》,就是討論各種實際的數學問題的求解方法。

C. 求演算法:把一個數M分成N個整數的和

我們要編寫一個函數,這個函數把一個數分為兩個數之和,並且這兩個數的乘積最大,這樣的函數是不是很好編寫,代碼如下:
void f1(int a, int *x,int *y){
*x=a/2;
*y=a-*x;
}
知道為什麼這樣分嗎,原理很簡單:兩個數都最大的時候,乘積才最大。也就是各取一半,如果a是奇數就讓y多1。

要完成把N分為多個數,使其乘積最大,我們就先分為兩個數,然後分別對這兩個數進行各自進行拆分(遞歸調用),直到分開的兩個數乘積比分前小,那就取消這次拆分。

基於以上說明,我們對f1函數進行修改,增加遞歸調用部分:
void f1(int n){
int x,y;
x=n/2;
y=n-x;
if (n>=x*y) printf("%d ",n);
else {f1(x);f1(y);}
}

添加計算乘積m的代碼,以及主程序,完成的如下:

-----------------
int m;

void f1(int n){
int x,y;
x=n/2;
y=n-x;
if (n>=x*y) {printf("%d ",n);m*=n;}
else {f1(x);f1(y);}
}

main(){
int n;
m=1;
scanf("%d",&n);
f1(n);
printf("\n%d",m);
}
-----------------
程序在SCO UNIX上運行通過,結果如下:
-----------------
$ cc a.c
$ a.out
9
4 2 3
24
$ a.out
10
2 3 2 3
36
$ a.out
12
3 3 3 3
81
$

D. 數分與高數哪個難學什麼區別都花幾年學

高中數學怎麼學?高中數學難學嗎?

數學這個科目,不管是對於文科學生還是對於理科學生.都是比較重要的,因為他是三大主課之一,它占的分值比較大.要是數學學不好,你可能會影響到物理化學的學習,因為那些學科都是要通過計算.然而,這些計算也都是在數學裡面.高中數學怎麼學?有哪些好的方法?

老師讓孩子上黑板做題

數學擔負著培養孩子的運算能力,還有孩子應用知識的能力.高中數學怎樣學?還是要看學生對數學的理解程度.學生要有自己的學習方法,你不光要掌握老師上課的內容,在下課之後還要及時鞏固,加深.

E. 統計學專業是學什麼的

本人是已經學習了兩年應用統計學的大學生了,下面我將以什麼是統計學?統計學專業學什麼?怎樣學習統計學?它的就業前景有哪些?這幾個點來談談我對它的理解。


以上是作為正在學習統計學的我,對這個專業作出的總結,希望能幫助到你。

F. 數學分析中的O和演算法中的O是一回事嗎我

按定義來講是一回事, 是統一的記號, 只不過演算法分析里的O大多數時候僅用於n->oo時的無窮大量(當然, O(1)不是無窮大量, 只是有界量), 而數學分析里則還經常會用於無窮小量

G. 數學與計算機演算法有什麼關系

數學是基礎學科,有豐富的數學基礎可以對理解編程中的邏輯有幫助。

編程對不同的人有不同的意義:

對於一般的程序員就是代碼的產出和可運行程序(數學在這裡面並不是特別重要,更重要的是對各種框架的理解、熟練掌握、設計模式等)。

對於演算法工程師來說,數學就很重要了(例如機器學習,密碼學,計算機圖形學等,當然這個對題主來說還太遙遠)。

題主說的函數實際上就是為了實現目的的一種封裝形式,而遞歸只是在函數中調用自身(當然需要終止條件)。

(7)數分和演算法擴展閱讀:

計算機的三個主要特徵

1、運算速度快:計算機內部電路能高速准確地完成各種算術運算。當今計算機系統的計算速度已達到每秒數萬億次運算,微機也可達到每秒一億次運算,使大量復雜的科學計算問題得以解決。例如,計算衛星軌道、大型水壩和24小時的天氣可能需要數年甚至數十年,而在現代,用電腦幾分鍾就可以完成。

2、計算精度高:科學技術的發展,特別是尖端科學技術的發展,對計算精度要求很高。計算機控制的導彈之所以能夠准確命中預定目標,與計算機的精確計算是分不開的。一般的計算機可以有十幾位甚至幾十位數字(二進制)有效數字,其計算精度可以從千分之幾到百萬分之一,是任何計算工具都無法比擬的。

3、邏輯操作能力強:計算機不僅可以進行精確計算,還具有邏輯操作功能,可以對信息進行比較和判斷。計算機可參與操作數據、程序、中間結果和最終結果保存,並可根據判斷結果自動執行下一條指令,供用戶隨時調用。

H. 數學分析、數值分析、數值演算法這三者有和本質區別

數學分析是數學專業的微積分。
數值分析或者偏向函數逼近論,或者偏向計算方法。
數值演算法是計算機的數值計算方法。

I. 數學分析中的O和演算法中的O 是一回事嗎 我沒分了,

你說的演算法中的O是指時間的復雜度吧,不能完全看作一回事,數分中有極限的過程,而在演算法中表示一種階數,演算法中的O(n),表示與n有相同的階數,在n前面可以加上任意一個確定的倍數,比如3n,5n,100n,都可以看成O(n),這是我自己的看法,僅供參考哈

J. 算術與演算法,算術與數學的區別和聯系

「算術」是一個學科的名稱。「演算法」顧名思義是一種計算方法而已。
「數學」是一個大的學科分類,裡麵包括「高等數學」「初級數學」「代數」幾何「」算術「等等、等等。
」算術「只是數學里的一個小的分類。一般是指小學里的課程。
現在,一般籠統地都叫數學:小學數學、中學數學、大學數學。沒有多少人再說」算術「了。
其實,我認為這樣不好。還是小學叫算術,中學叫代數、幾何.....,大學冠以」高等「。這樣比較好。

熱點內容
c語言程序操作 發布:2025-05-10 01:23:04 瀏覽:410
ad濾波演算法 發布:2025-05-10 01:17:59 瀏覽:893
自製網路存儲 發布:2025-05-10 01:03:29 瀏覽:504
java防重復提交 發布:2025-05-10 01:02:32 瀏覽:736
如何在家用樂高製作解壓玩具 發布:2025-05-10 00:55:07 瀏覽:438
linux的mtu 發布:2025-05-10 00:54:52 瀏覽:154
android判斷root 發布:2025-05-10 00:44:06 瀏覽:688
if條件編譯 發布:2025-05-10 00:21:02 瀏覽:72
圓管根數演算法 發布:2025-05-10 00:18:55 瀏覽:676
中短發編程 發布:2025-05-10 00:16:07 瀏覽:39