BREIMAN AND CUTLER'S RANDOM FORESTS
Random Forests®
基於CART分類與迴歸樹,Random Forests®(隨機森林)模組統整了整個森林的CART樹的預測結果,同時確保決策樹不會互相影響。
對於那些不熟悉“隨機森林”的人來說,這是由加利福尼亞大學伯克利分校的Leo Breiman和Adele Cutler開發的強大集成技術,並受到許多預測建模從業者的青睞。 該算法具有欺騙性的簡潔,藉由構建數百棵獨立的樹,從觀察值和變數中使用大量抽樣。 Random Forests具有根據現成的數據,評估不偏模型性能的獨特能力,無需額外的測試/驗證樣本。 此能力立即使隨機森林成為廣泛數據應用中最重要的預測建模工具,在這些應用中,變數的數量超過了觀測值數量(可能是好幾倍)。
問責制
隨機森林具有獨特的功能,可以利用數據集中的每條記錄,且不會產生過度擬合/配適的危險。 這對於小型數據(尤其是觀測行數據)而言更為重要,在小型數據中,每條記錄都可能會貢獻一些有價值的資訊。 隨機森林將確保您的模型中考慮了所有資料,不會丟失任何有價值的資訊與見解。
穩健變數重要性
隨機森林利用新穎的技術,根據其重要性對變數進行排名。 當數據包含成千上萬甚至數十萬的變數或預測變數時非常方便,這遠遠超出了常見迴歸和分類工具的可處理範圍。 Random Forest可以處理這種極端情況,並回報在後續研究中使用的重要變量。 多輪抽樣將為這些洞察力增加穩健性和品質。
Minitab 內基於樹的模組
無論您是剛起步,還是期望將預測分析能力提高到下一個新水平,Minitab基於樹的模組將能滿足您的需求。
CART®
徹底改變高級分析,並開啟當前數據科學時代的終極分類樹演算法。
Random Forests®
可同時利用多種替代分析、隨機化策略和集成學習的能力。
TreeNet®
最靈活、強大的機器學習工具,能一致地生成極其準確的模型。
準備好探索 Minitab 的預測分析解決方案了嗎?