공시정보 Opendart(기업개요 및 재무제표)와 공공데이터 포털(온실가스 배출량)을 통한 자료 수집과 분석은 아래 툴을 통해서 진행하시면 됩니다.
공시정보 Opendart 자료 Python으로 받아오기**:**
파이썬 라이브러리 : https://github.com/FinanceData/OpenDartReader
Opendart API 신청 : https://opendart.fss.or.kr/uss/umt/EgovMberInsertView.do
*Opendart는 정말 다양한 데이터를 제공하고 있으니 개발가이드를 잘 확인해주세요.
우리의 목표 데이터 :
기업개황 : https://opendart.fss.or.kr/guide/detail.do?apiGrpCd=DS001&apiId=2019002
공시원본 파일 : https://opendart.fss.or.kr/guide/detail.do?apiGrpCd=DS001&apiId=2019003
공공데이터 포털(온실가스 배출량) 자료:
공공데이터포털 : https://www.data.go.kr/data/15053947/fileData.do
*API가 아닌 웹사이트 정보를 받아오면 됩니다.
이번 주차에서는 Opendart에서 제공하는 데이터와 공공데이터포털의 자료를 어떻게 의미있게 사용할 수 있을지 고민해보는 주차입니다.
Opendart 데이터를 활용함에 있어 도움이 되시길 바라면서 제가 생각하는 필수적인 데이터를 공유해드립니다.
기업개황 : https://opendart.fss.or.kr/guide/detail.do?apiGrpCd=DS001&apiId=2019002
파편처럼 퍼져있는 다양한 데이터를 합치기 위해 법인을 구분할 수 있는 최대한 많은 데이터를 축적하는 것이 중요합니다. 또한, 법인의 업종을 1차적으로 분류할 수 있는 업종코드는 추후 분석에 필요합니다.
공시원본 파일 : https://dart.fss.or.kr/dsab007/main.do
기업의 기업보고서에는 기업을 분류하거나, 현황 및 거래 파트너를 파악하기 위해서 꼭 필요한 자료가 담겨 있습니다. 다음과 같은 구체적인 User case를 생각해볼 수 있습니다.
‘1차적인 업종코드 → 세부적인 주요 제품’으로 기업을 2차분류
NLP를 통해 사업현황에 대한 메시지를 파악
해외진출 현황 및 거래 파트너 확인, 등
공공데이터포털을 통한 온실가스 배출량 확인
온실가스 데이터 : http://www.gir.go.kr/home/index.do?menuId=37
온실가스 데이터 자체로는 의미없을수도 있지만, 저라면 다음 데이터들과의 관계를 파악하기 위해 노력하겠습니다.
대한민국 연도별 탄소배출 감축목표와 연계
전세계 친환경 투자액 추이에 따라 온실가스를 배출하는 기업들의 비용 추이와의 관계
제 예시들은 여러분들이 조금 편하게 Ideation 할 수 있도록 제시하는 기본적인 예시안입니다.
여러분들께서는 1주 동안 데이터의 생김새(분포), 특성, 집계방법, 주기, 등 데이터 자체에 대한 영역부터 신용평가에 활용에 직접적으로 영향을 논리적 관계, Feature 생성, Null 값 처리방안, 등 전 영역에 걸쳐서 고민해주셨으면 좋겠습니다.
2주차 과제 건승을 빕니다.
하단의 각 질문에 대한 답변을 정리해 제출해주세요.