안녕하세요 넘블 리서처님!

넘블 리서치 2주차에 오신 걸 환영합니다! 🤩

공시정보 Opendart(기업개요 및 재무제표)와 공공데이터 포털(온실가스 배출량)을 통한 자료 수집과 분석은 아래 툴을 통해서 진행하시면 됩니다.

공시정보 Opendart 자료 Python으로 받아오기**:**

파이썬 라이브러리 : https://github.com/FinanceData/OpenDartReader

Opendart API 신청 : https://opendart.fss.or.kr/uss/umt/EgovMberInsertView.do

*Opendart는 정말 다양한 데이터를 제공하고 있으니 개발가이드를 잘 확인해주세요.

우리의 목표 데이터 :

기업개황 : https://opendart.fss.or.kr/guide/detail.do?apiGrpCd=DS001&apiId=2019002

공시원본 파일 : https://opendart.fss.or.kr/guide/detail.do?apiGrpCd=DS001&apiId=2019003

공공데이터 포털(온실가스 배출량) 자료:

공공데이터포털 : https://www.data.go.kr/data/15053947/fileData.do

*API가 아닌 웹사이트 정보를 받아오면 됩니다.

2주차의 주제는 Opendart와 공공데이터 활용입니다.

이번 주차에서는 Opendart에서 제공하는 데이터와 공공데이터포털의 자료를 어떻게 의미있게 사용할 수 있을지 고민해보는 주차입니다.

Opendart 데이터를 활용함에 있어 도움이 되시길 바라면서 제가 생각하는 필수적인 데이터를 공유해드립니다.

기업개황 : https://opendart.fss.or.kr/guide/detail.do?apiGrpCd=DS001&apiId=2019002

Untitled

파편처럼 퍼져있는 다양한 데이터를 합치기 위해 법인을 구분할 수 있는 최대한 많은 데이터를 축적하는 것이 중요합니다. 또한, 법인의 업종을 1차적으로 분류할 수 있는 업종코드는 추후 분석에 필요합니다.

공시원본 파일 : https://dart.fss.or.kr/dsab007/main.do

Untitled

Untitled

기업의 기업보고서에는 기업을 분류하거나, 현황 및 거래 파트너를 파악하기 위해서 꼭 필요한 자료가 담겨 있습니다. 다음과 같은 구체적인 User case를 생각해볼 수 있습니다.

  1. ‘1차적인 업종코드 → 세부적인 주요 제품’으로 기업을 2차분류

  2. NLP를 통해 사업현황에 대한 메시지를 파악

  3. 해외진출 현황 및 거래 파트너 확인, 등

공공데이터포털을 통한 온실가스 배출량 확인

온실가스 데이터 : http://www.gir.go.kr/home/index.do?menuId=37

Untitled

온실가스 데이터 자체로는 의미없을수도 있지만, 저라면 다음 데이터들과의 관계를 파악하기 위해 노력하겠습니다.

  1. 대한민국 연도별 탄소배출 감축목표와 연계

  2. 전세계 친환경 투자액 추이에 따라 온실가스를 배출하는 기업들의 비용 추이와의 관계

제 예시들은 여러분들이 조금 편하게 Ideation 할 수 있도록 제시하는 기본적인 예시안입니다.

여러분들께서는 1주 동안 데이터의 생김새(분포), 특성, 집계방법, 주기, 등 데이터 자체에 대한 영역부터 신용평가에 활용에 직접적으로 영향을 논리적 관계, Feature 생성, Null 값 처리방안, 등 전 영역에 걸쳐서 고민해주셨으면 좋겠습니다.

2주차 과제 건승을 빕니다.

2주차 과제 제출 양식

하단의 각 질문에 대한 답변을 정리해 제출해주세요.