You are viewing a single comment's thread from:
RE: 파이썬 머신러닝 #3 - 스팀잇 아이디로 성별 예측하기
에잉 농담이시겠지만 다큐로 받자면 이건 아이디엔 적용 안되죠. 말 그대로 서구권 세례명에 적용되는 얘기. 가령 한국식 이름에도 아, 화, 희, 등이 끝자리면 여자이름일 확률이 높다는 식의 얘기인데 아이디는 그냥 사물일 수도 있고 짓는 사람이 맘대로 하는 거니까.
에잉 농담이시겠지만 다큐로 받자면 이건 아이디엔 적용 안되죠. 말 그대로 서구권 세례명에 적용되는 얘기. 가령 한국식 이름에도 아, 화, 희, 등이 끝자리면 여자이름일 확률이 높다는 식의 얘기인데 아이디는 그냥 사물일 수도 있고 짓는 사람이 맘대로 하는 거니까.
재미를 주려고 스팀잇 아이디를 끼워 넣었습니다.😁
한국식 이름도 끝자리로 성별을 예측할 수 있겠네요. 그리고 제이미님 말대로 아이디만으로 성별을 예측하는 것은 어렵습니다.
아이디가 지칭하는 사물의 종류를 기반으로 예측을 하도록 데이터를 넣으면 좀더 정답에 근접할 수 있겠죠. 그래도 이름에 비해선 정확도가 현저히 떨어지겠지만.
아이디만으로 성별을 예측하는 것을 힘듭니다. 아이디를 포함하여 스팀잇에 작성한 글이나 댓글을 분석해서 성별을 예측해야 정확도가 올라갈 것 같습니다.
네, 힘들다는건 제 원래 요지이기도 하죠. 제가 거기에 덧붙여서 얘기한건 아이디가 지칭하는 꽃, 고양이, 나무 등의 사물에서 확률을 조금 더 높여볼 수 있으리라는 얘기입니다. 아이디가 저나 뉴비존님처럼 세례명을 포함할 수도 있고요. 당연히 글, 댓글 등 기타 데이터를 추가 하면 더더욱 높아지겠지만, 원글에서도 아이디만 다루고 있으니 아이디에만 집중해봤죠. ㅎㅎ
이전 답변을 제가 이해를 못했었네요. 맞습니다. 아이디가 지칭하는 사물을 기준으로 하면 정확도를 더 높일 수 있을 거라고 생각됩니다. 답변 감사합니다.