음악프로젝트 데이터의 NaN 값은 처리 하였으나
중복답변이 있다는것을 알아차린후 현재 고유값들을 분리한느 작업중에 있음.
또한 차트 그리는 것을 함수로 작성하여 모듈화 한 후 for 문을 돌리니 전체속성에 대해 그래프 그리기가 수월했다.
def pigraph(a):
df_count=df_spo[a].value_counts()
xlabel=[]
ylabel=[]
for i in df_spo[a].unique():
xlabel.append(i)
ylabel.append(df_count[i])
plt.pie(ylabel,labels=xlabel,labeldistance=1.2,autopct='%.1f')
plt.legend(loc=(1.1,0.0))
plt.show()
df_spo.columns
Index(['Age', 'Gender', 'spotify_usage_period', 'spotify_listening_device',
'spotify_subscription_plan', 'premium_sub_willingness',
'preffered_premium_plan', 'preferred_listening_content',
'fav_music_genre', 'music_time_slot', 'music_Influencial_mood',
'music_lis_frequency', 'music_expl_method', 'music_recc_rating',
'pod_lis_frequency', 'fav_pod_genre', 'preffered_pod_format',
'pod_host_preference', 'preffered_pod_duration',
'pod_variety_satisfaction'],
dtype='object')
for i in df_spo.columns:
print(i)
pigraph(i)
이러한 방법을 활용하여 데이터를 그린뒤 현황보고 및 서비그개선사항을 도출하는것이 중요한 포인트가 될것같다.
(계속)