본문 바로가기

카테고리 없음

240726 TIL

 

음악프로젝트 데이터의 NaN 값은 처리 하였으나

 

중복답변이 있다는것을 알아차린후 현재 고유값들을 분리한느 작업중에 있음.

 

 

또한 차트 그리는 것을 함수로 작성하여 모듈화 한 후 for 문을 돌리니 전체속성에 대해 그래프 그리기가 수월했다.

 

def pigraph(a):
    df_count=df_spo[a].value_counts()
    
    xlabel=[]
    ylabel=[]
    for i in df_spo[a].unique():
        xlabel.append(i)
        ylabel.append(df_count[i])
        
    plt.pie(ylabel,labels=xlabel,labeldistance=1.2,autopct='%.1f')
    plt.legend(loc=(1.1,0.0))
    plt.show()
df_spo.columns
Index(['Age', 'Gender', 'spotify_usage_period', 'spotify_listening_device',
       'spotify_subscription_plan', 'premium_sub_willingness',
       'preffered_premium_plan', 'preferred_listening_content',
       'fav_music_genre', 'music_time_slot', 'music_Influencial_mood',
       'music_lis_frequency', 'music_expl_method', 'music_recc_rating',
       'pod_lis_frequency', 'fav_pod_genre', 'preffered_pod_format',
       'pod_host_preference', 'preffered_pod_duration',
       'pod_variety_satisfaction'],
      dtype='object')
for i in df_spo.columns:
    print(i)
    pigraph(i)

 

 

이러한 방법을 활용하여 데이터를 그린뒤 현황보고 및 서비그개선사항을 도출하는것이 중요한 포인트가 될것같다.

 

 

(계속)