From f5aa4a3303cba9fc61bf5ab83d4b63376c9781c9 Mon Sep 17 00:00:00 2001 From: Haesun Park Date: Sat, 17 Jul 2021 10:51:56 +0900 Subject: [PATCH] =?UTF-8?q?=EB=85=B8=ED=8A=B8=EB=B6=81=20=EB=B2=88?= =?UTF-8?q?=EC=97=AD?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- notebooks/feature_importance.ipynb | 16 ++++++++-------- 1 file changed, 8 insertions(+), 8 deletions(-) diff --git a/notebooks/feature_importance.ipynb b/notebooks/feature_importance.ipynb index 4c371a6..e608db2 100644 --- a/notebooks/feature_importance.ipynb +++ b/notebooks/feature_importance.ipynb @@ -4,11 +4,11 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "# Inspect feature importance\n", + "# 특성 중요도 조사\n", "\n", - "A good way to diagnose a model's performance is to examine which features it uses the most to make predictions, and which features don't seem to help at all. This is called feature importance analysis.\n", + "모델 성능을 분석하는 한 가지 좋은 방법은 예측을 만드는데 어떤 특성이 가장 많이 사용되고 어떤 특성이 전혀 도움이 되지 않는지 조사하는 것입니다. 이를 특성 중요도 분석이라고 합니다.\n", "\n", - "To do so, we first load the data." + "먼저 데이터를 로드합니다." ] }, { @@ -46,7 +46,7 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "Then, we add features and split the data." + "그다음 특성을 추가하고 데이터를 나눕니다." ] }, { @@ -63,7 +63,7 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "We load the pretrained model and vectorizer." + "사전 훈련된 모델과 벡터화 객체를 로드합니다." ] }, { @@ -82,7 +82,7 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "We vectorize the text and get features ready for our model" + "텍스트를 벡터로 변환하고 모델을 위해 특성을 준비합니다." ] }, { @@ -108,7 +108,7 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "Now, we can leverage sklearn's api to display the most and least important features." + "이제 사이킷런 API를 사용해 가장 중요한 특성과 그렇지 않은 특성을 출력합니다." ] }, { @@ -172,7 +172,7 @@ "cell_type": "markdown", "metadata": {}, "source": [ - "We can see that the text length is the most important feature. The next most important features seem like common English words. In order to use this model to provide useful writing suggestions, we should work on generating features values that would be **easier** to turn into actionable writing advice." + "텍스트 길이가 가장 중요한 특성임을 볼 수 있습니다. 그다음 중요한 특성은 자주 사용되는 영어 단어입니다. 유용한 글쓰기 추천을 제공하기 위해 모델을 사용하려면 행동으로 옮길 수 있는 글쓰기 추천으로 쉽게 변환할 수 있는 특성을 만들어야 합니다." ] } ],