Post

데이터 분석 프로젝트의 좋은 문장과 나쁜 문장

최근 다른 훈련을 받은 학생들의 포트폴리오를 볼 기회가 많이 있었는데, 여러가지로 안타까운 부분이 많았다. 그 중에서 가장 눈에 띄이는 부분에 대해서 정리해 본다.

데이터 분석 프로젝트의 좋은 문장과 나쁜 문장

좋은 문장과 나쁜 문장의 차이는 무엇인가

데이터 분석 포트폴리오에서 문장의 좋고 나쁨은 문법이나 표현력이 아니라, 사고의 흔적이 남아 있는지 여부로 결정됩니다.

1. 나쁜 문장은 “사실만 말하고”, 좋은 문장은 “판단을 드러낸다”

나쁜 문장은 보통 이렇게 생겼습니다.

1
2
“결측치를 제거하였다.”
“로지스틱 회귀를 사용하였다.”

이 문장들은 틀리지 않았지만, 아무 생각도 하지 않은 것처럼 보입니다.

왜냐하면 왜 제거했는지, 왜 그 방법을 썼는지, 다른 선택지는 무엇이었는지 아무것도 드러나지 않기 때문입니다.

좋은 문장은 여기에 판단의 이유가 붙습니다.

1
2
“결측치가 특정 변수에 집중되어 있어, 분석 왜곡을 방지하기 위해 제거하였다.”
“해석 가능성을 확보하기 위해 로지스틱 회귀를 기본 모형으로 설정하였다.”

같은 행동을 설명하지만, 선택했다는 흔적이 남습니다.

2. 나쁜 문장은 “결과를 평가하고”, 좋은 문장은 “결과를 설명한다”

나쁜 문장에서는 결과가 이렇게 표현됩니다.

1
2
“정확도가 높게 나왔다.”
“의미 있는 결과를 얻었다.”

이 문장들은 무엇과 비교했는지, 어느 정도인지, 왜 중요한지 아무 정보도 주지 않습니다.

그래서 평가자는 이렇게 느낍니다.

“이건 결과가 아니라 감상이다.”

좋은 문장은 결과를 구조적으로 설명합니다.

1
2
“기준선 대비 성능이 일관되게 향상되었다.”
“해당 변수는 다른 변수 대비 가장 큰 기여도를 보였다.”

여기에는 비교 기준, 상대적 위치 해석의 근거가 담겨 있습니다.

3. 나쁜 문장은 “말을 키우고”, 좋은 문장은 “범위를 통제한다”

학생들이 자주 쓰는 나쁜 문장은 과하게 커진 표현을 가집니다.

1
2
“다양한 활용 가능성이 있을 것으로 기대된다.”
“본 분석은 중요한 시사점을 제공한다.”

이 문장들은 아무 책임도 지지 않습니다.

어디까지 가능한지 말하지 않기 때문입니다.

좋은 문장은 말할 수 있는 범위와 말할 수 없는 범위를 함께 정리합니다.

1
2
“해당 결과는 특정 조건 하에서 의사결정 시 참고 지표로 활용될 수 있다.”
“표본 특성상 결과 해석은 해당 데이터 범위에 한정된다.”

이 문장은 자기 통제 능력을 보여줍니다.

4. 나쁜 문장은 “기술을 나열하고”, 좋은 문장은 “선택을 정당화한다”

나쁜 문장은 보통 이런 흐름을 가집니다.

1
2
“EDA를 진행하였다.”
“머신러닝 모델을 적용하였다.”

여기에는 분석가가 사라져 있습니다.

도구만 남아 있습니다.

좋은 문장은 도구 뒤에 숨은 의사결정을 꺼냅니다.

1
2
“데이터 분포와 변수 특성을 파악하기 위해 EDA를 먼저 수행하였다.”
“비선형 관계를 고려할 필요가 있어 트리 기반 모델을 추가로 적용하였다.”

이 순간, 독자는 도구가 아니라 분석가를 봅니다.

5. 나쁜 문장은 “논문 흉내”를 내고, 좋은 문장은 “자기 사고를 말한다”

나쁜 문장은 자주 이런 톤을 씁니다.

1
2
“본 연구는 기존 연구와 차별성을 가진다.”
“다양한 분석을 통해 유의미한 결과를 도출하였다.”

이건 논문 문장을 외운 흔적이지, 생각한 흔적이 아닙니다.

좋은 문장은 비교하지 않고도 관점을 드러냅니다.

1
2
“본 분석은 예측 정확도보다 변수의 영향력 해석에 초점을 두었다.”
“결과 자체보다, 결과가 형성되는 과정을 설명하는 데 목적이 있다.”

누구와 다른지를 말하지 않아도, 무엇을 선택했는지가 분명합니다.

6. 반드시 기억해야 할 점

좋은 문장은 ‘무엇을 했다’가 아니라 ‘왜 그렇게 선택했는지’를 남긴 문장입니다.

그리고 이 질문을 항상 스스로에게 던져야 합니다.

1
2
“이 문장을 읽고,
내가 생각했다는 흔적이 보이는가?”

이 질문에 YES라고 답할 수 있다면, 그 문장은 이미 좋은 문장입니다.

This post is licensed under CC BY 4.0 by the author.