스팀잇 이상탐지 보고서(v2.0)-오후(UTC) (2017-08-21 12:00:00 ~ 2017-08-22)

in #kr7 years ago (edited)

본 보고서는 공개되어있는 데이터를 활용하여 스팀잇내에서 의심되는 행동(Suspicious Behaviour)을 하는 유저들을 잡아냅니다. 스팀잇 구조상 글 작성자와 구독자는 보팅을 통해 보상을 받게 됩니다. 글 작성자에게는 글 작성에 대한 노력에 대한 보상으로 author rewards를 그리고 보팅을 한 유저에게는 curation rewards을 받게 되는데요, 현제 스팀잇은 글(article)이나 댓글(comment)를에 대해 보팅을 할 수 있게 되어있습니다. 여기서 자신이 작성한 글/댓글에 보팅을 통한 보상도 가능 한데요. 물론 이것이 나쁘다는건 아닙니다. 최소한 자신이 공들여 작성한 글에 최소한에 보상을 받을 수 있으니까요. 하지만 이 시스템을 악용하는 사례들도 있습니다. 

저는 Block-Chain 기술의 가장 큰 장점이 모든 거래정보를 공개하는 것에 있다고 보는데요. Black-chain 기술 기반으로 만들어진 스팀잇내에서는 유저의 모든행동, 글/댓글 작성 및 보팅 내역 포함이 모두 공개 되어 있습니다. 하지만 모든 사람이 스팀잇이 제공하는 정보를 쉽게 접근 할 수는 없는데요. 이 보고서의 취지는 스팀잇에서 공개하는 데이터를 될 수 있으면 모든사람들이 쉽게 받아들일 수 있는 형태로 가공/전달 하는데에 있습니다. 

                  현재로선 유저의 실제 아이디명은 공개 하지 않겠습니다. 다만 Block-chain 기술은 당신의 모든 행동을 정보화 하면 공개되어있다는 사실을 아셨으면 합니다. 

데이터 기간 (2017-08-21 12:00:00 ~ 2017-08-22) 

-총 데이터 수: 10820 

-기간내의 총 스팀잇 유저수: 4539 

Self-Voting (SV) 

 

상단에 위치한 그래프는 2017-08-21 12:00:00 ~ 2017-08-22 동안 자신의 글/댓글에 보팅을(=SV)하신 SV수-유저수를 보여줍니다. 

총 4539 SV 유저 분석결과 평균 SV수는 2.38 ,최대 SV수는 142 그리고 분포는 4 로 나타났습니다 (상단 그래프). 

2017-08-21 12:00:00 ~ 2017-08-22 동안 자신의 글/댓글에 보팅을 한 Top 10: 

 

Self-Voting 탑 10 유저의 7일 동안의 보팅 패턴 

 

위 네트워크는 (2017-08-14 ~ 2017-08-22)기간 동안 SV유저(빨강색)들의 보팅 패턴을 통한 다른 유저들과의 관계를 보여줍니다. 

 

Self-Voting 1위~5위 

 

Self-Voting 6위~10위 

 

상단에 위치한 그래프는 SV 기준 상위 10명에 대한 날짜별 (2017-08-14 ~ 2017-08-22) 동안 총 보팅수(회색), SV수(빨강) 그리고 다른유저에 대한 보팅수(파란색)를 보여줍니다. 

High-Self-Voter(H-SV) 스팀잇 유저들의 Suspicious 스코어 

H-SV 스팀잇 유저들의 Suspicious 스코어는 다음 특징들을 가지고 추출합니다: 

-보팅파워(VP) -- 유저의 보팅별 보팅파워 

-보팅수(voting_cnt) -- 기간동안 유저의 총 보팅수 

-셀프 보팅수(sv_voting_cnt) -- 기간동안 유저가 자신의 글/댓글의 보팅수 

-타유저 보팅수(nsv_voting_cnt) -- 기간동안 유저가 다른 타유저에게 한 보팅수 

-타유저수(author) -- 기간동안 유저가 보팅한 타유저수 

위 특징들에서 추출된 지표들은 다음과 같습니다: 

-평균 셀프 보팅 파워(sv_avg_vp) -- 유저가 자신에게준 평균 보팅파워 (=SV 총 VP합/sv_voting_cnt) 

-평균 타유저 보팅 파워(nsv_avg_vp) -- 유저가 타유저가준 평균 보팅파워 (=NSV 총 VP합/nsv_voting_cnt) 

-셀프 보팅비율(sv_ratio) -- 유저의 셀프보팅 비율 (=sv_voting_cnt/voting_cnt * 100) 

-평균 타유저 보팅수(VPA) -- 타유저가 밭은 평균 보팅수 (=nsv_voting_cnt/author) 

보상측정을 위한 가상지표들은 다음과 같습니다 (USD): 

-가상 총 자기자신 보상금액(SR - Self Rewards) -- 유저의 보팅보상을 $1로 봤을때의 자신의 총 보상액 (=(1 * sv_avg_vp) * sv_voting_cnt) 

-가상 총 타유저 보상금액(NSR - Not Self Rewards) -- 유저의 보팅보상을 $1로 봤을때의 타유저의 총 보상액 (=(1 * nsv_avg_vp) * nsv_voting_cnt) 

-평균 타유저 보상금액(RPU) -- 유저의 보팅보상을 $1로 봤을때의 타유저의 평균 보상액 (=NSR/author) 

 

(2017-08-21 12:00:00 ~ 2017-08-22)기간 동안 H-SV 스팀잇 유저들의 보팅 패턴(보팅수(voting_cnt), 셀프 보팅수(sv_voting_cnt), 타유저 보팅수(nsv_voting_cnt), 타유저수(author), 셀프 보팅비율(sv_ratio), 평균 타유저 보팅수(VPA))분포을 보여줍니다. 

H-SV 스팀잇 유저중에서 상대적으로 보팅비율(SV_Ratio)이 높은 유저(9~10)들의 보팅 패턴 - 빨강색 

H-SV 유저의 지표들의 값을 평준화이후 구간을 0~10 등급으로 변환 시킨 값입니다. SV 지표들은 등급이 높을수록 그리고 NSV 지표들은 등급이 낮을수록 Suspicious에 가깝다고 보시면 됩니다.  

H-SV 스팀잇 유저의 보팅 보상을 $1로 계산했을때 자신(빨강색)과 타유저(파랑색) 보상 분포입니다. 

Sort:  

이런 훌륭한 정보가 아직도 제대로 쓰여지지 않다니요! 셀프보팅은 못하게 막아놓는건 어떨지 생각해봅니다.

Coin Marketplace

STEEM 0.21
TRX 0.25
JST 0.038
BTC 95830.75
ETH 3363.86
USDT 1.00
SBD 3.08