술어 예제

이것은 NuPIC의 사용을 보여주는 예일 뿐이며 기존 기술과의 비교를 주장하지 않습니다. 데이터 집합의 일부가 아래에 표시됩니다. 마지막 변수인 CAT입니다. MEDV는 MEDV 변수의 불연속 분류이며 이 예에서는 사용되지 않습니다. 이 예제에서는 XLMiner의 k-가까운 이웃 예측 메서드의 사용을 보여 줍니다. XLMiner 리본에서 모델 적용 탭에서 도움말 – 예제를 선택한 다음 예측/데이터 마이닝 예제를 선택하여 Boston_Housing.xlsx 예제 데이터 세트를 엽니다. 이 데이터 집합에는 아래 표에 설명된 14개의 변수가 포함되어 있습니다. 종속 변수 MEDV는 주거의 중앙값입니다. 이 예제의 목적은 이 변수의 값을 예측하는 것입니다. 이 예제에서는 HTMPredictionModel이 있는 SDRCategoryEncode를 사용하여 웹 페이지 범주의 시퀀스로 설명된 사용자 세션에서 시간적 패턴을 추출하여 웹 사이트 트래픽 데이터를 분석하는 방법을 보여 줍니다. 특히 계량 경제학에서 예측 간격 대신 신뢰 구간을 사용하는 것이 매우 일반적입니다.

그러나 정확한 결과를 얻으려면 신뢰 수준 대신 예측 간격을 사용해야 합니다. 비즈니스의 평균 일일 지출에 대한 신뢰 구간을 계산하고 $5,000에서 $6,000 사이라고 가정해 보겠습니다. 즉, 평균이 아마 거짓말을 어디 알려줍니다. 이 CI를 사용하여 예측 간격을 만드는 경우 간격이 훨씬 좁아집니다. 예를 들어 예측 간격은 동일한 신뢰 수준에서 $2,500 ~ $7,500일 수 있습니다. 신뢰 구간을 사용하는 경우 해당 간격에 오류가 더 많을 가능성이 높으며, 이는 값이 예상보다 더 자주 해당 간격을 벗어나는 것을 의미합니다. 신뢰 구간은 항상 신뢰 수준과 연관되어 불확실성의 정도를 나타냅니다(데이터는 무작위이므로 통계 분석의 결과는 100% 확실하지 않습니다). 예를 들어 배터리의 평균 수명(95% 신뢰 수준)은 100~110시간이라고 말할 수 있습니다. 이것은 배터리가 시간의 95 %의 100 ~ 110 시간 범위에 속한다는 것을 알려줍니다.

RROC 곡선에서 회귀기의 성능을 과소 평가가 예상치 미만으로 이동한 과대 평가와 동일한 임의 추측(빨간색 선)의 성능과 비교할 수 있습니다. 이 줄의 왼쪽에 있는 모든 것은 더 나은 예측을 의미하고 오른쪽에 있는 모든 것은 더 나쁜 예측을 의미합니다. 최상의 예측 성능은 x축과 y축의 교차점에서 그래프왼쪽 상단에 있는 점으로 표시됩니다. 이 점을 완벽한 분류라고도 합니다. 곡선 위의 영역(AOC)은 ROC 곡선 위에 나타나는 그래프의 공간으로 공식을 사용하여 계산됩니다: sigma2 * n2/2 여기서 n은 레코드 수가 AOC가 작을수록 모델의 성능이 향상됩니다. 이 예제에서는 교육 집합의 곡선 위의 영역이 0이며 이는 완벽한 분류 또는 0오분류 오류를 나타냅니다.