Objectif

Effectuer une analyse (non) financière à l'aide de "CoARiJ"
Évolution des performances commerciales et de l'écriture ESG au fil du temps
Vérification du rapport Ito
Investissement ESG réel plutôt que corrélation avec la performance de l'entreprise

Voir ci-dessous pour "CoARiJ" https://www.tis.co.jp/news/2019/tis_news/20191114_1.html https://github.com/chakki-works/CoARiJ/blob/master/README.md

Dernière fois

https://qiita.com/vbnshin/items/09be86b4793c68f70172

Choses à faire

Vérification du jeu de données

Résumé

Les données financières sont-elles incorrectes? Soyez prudent lors de l'analyse! !!

Les données

Les données fournies par "CoARiJ" sont les suivantes

Données financières
données financières (à partir des informations des états financiers)
Y a-t-il une erreur? </ b>

données boursières (à partir du tableau mensuel des prix du marché (stock domestique))

La liste est la suivante

Données non financières

Rapport annuel (à partir d'EDINET, format de fichier XBRL)

Le fichier a analysé l'élément ci-dessus par élément (format txt)

Rapport RSE (format pdf)

Non disponible au format txt </ b>

Les types de documents obtenus auprès d'EDINET sont les suivants (exercice 2018)

Points à garder à l'esprit lors de l'analyse

Il y a des données en double

df_14 = pd.read_csv('../data/finance_reports/2014/2014/documents.csv', sep='\t') dup_name = df_14[df_14.duplicated()].iloc[0]['filer_name'] df_14[df_14['filer_name'] == dup_name]

edinet_code sec_code jcn filer_name fiscal_year fiscal_period submit_date period_start period_end doc_id ... operating_income_on_sales ordinary_income_on_sales capital_ratio dividend_payout_ratio doe open high low close average 55 E00091 19710 2010001034861 Chuo Built Industry Co., Ltd. 2014 FY 2015-06-24 2014-04-01 2015-03-31 S10053TB ... 7.78 7.41 31.99 14.01 1.69 139.0 208.0 108.0 118.0 139.25 56 E00091 19710 2010001034861 Chuo Built Industry Co., Ltd. 2014 FY 2015-06-24 2014-04-01 2015-03-31 S10053TB ... 7.78 7.41 31.99 14.01 1.69 139.0 208.0 108.0 118.0 139.25

Le code Edinet fluctue

df_14 = pd.read_csv('../data/finance_reports/2014/2014/documents.csv', sep='\t') df_14 = df_14.groupby('edinet_code').max().reset_index() df_14_part = df_14[['filer_name', 'fiscal_year', 'roa']] dup_name = df_14_part[df_14_part['filer_name'].duplicated()].iloc[0]['filer_name'] df_14[df_14_part['filer_name'] == dup_name][['edinet_code', 'sec_code', 'jcn', 'filer_name', 'fiscal_year', 'fiscal_period', 'submit_date']]

edinet_code sec_code jcn filer_name fiscal_year fiscal_period submit_date 245 E00484 28140 5180001075845 Sato Food Industry Co., Ltd.2014 FY 2015-06-26 263 E00510 29230 8110001002068 Sato Food Industry Co., Ltd.2014 FY 2015-07-24

Pas de ROE moins entreprise (mademoiselle?)

df_14 = pd.read_csv('../data/finance_reports/2014/2014/documents.csv', sep='\t') df_14 = df_14.groupby('edinet_code').max().reset_index() df_15 = pd.read_csv('../data/finance_reports/2015/2015/documents.csv', sep='\t') df_15 = df_15.groupby('edinet_code').max().reset_index() df_16 = pd.read_csv('../data/finance_reports/2016/2016/documents.csv', sep='\t') df_16 = df_16.groupby('edinet_code').max().reset_index() df_17 = pd.read_csv('../data/finance_reports/2017/2017/documents.csv', sep='\t') df_17 = df_17.groupby('edinet_code').max().reset_index() df_18 = pd.read_csv('../data/finance_reports/2018/2018/documents.csv', sep='\t') df_18 = df_18.groupby('edinet_code').max().reset_index() df = pd.concat([df_14, df_15, df_16, df_17, df_18]) df = df[~df.duplicated()] df[df['filer_name'].isin(['Sato Food Industry Co., Ltd.', 'Alpha Co., Ltd.', 'Fujiko Co., Ltd.'])] print(len(df[df['roe'] < 0])) >>> 0

.. ..

Correspondance avec des données positives

ROE (Capital Profit Margin) de l'affichage du Japon

[Rapport sur les valeurs mobilières - 16e mandat (1er avril 2017 au 31 mars 2018)] (https://disclosure.edinet-fsa.go.jp/E01EW/download?uji.verb=W0EZA104CXP001003Action&uji.bean=ee.bean.parent.EECommonSearchBean&PID=W1E63011&SESSIONKEY=157577051050bbn&SESSIONKEY=157577051050bn = & preId = 1 & mul = Japan Display & fls = on & cal = 2 & yer = 2018 & mon = & pfs = 5 & row = 100 & idx = 0 & str = & kbn = 1 & flg = & syoruiKanriNo = & s = S100D87L)

Valeur de "CoARiJ"

df[df['edinet_code'] == 'E30481'][['edinet_code', 'filer_name', 'fiscal_year', 'roe']]

edinet_code filer_name fiscal_year roe 3160 E30481 Japan Display Co., Ltd. 2014 4.13 3196 E30481 Japan Display Co., Ltd. 2015 2.92 3270 E30481 Japan Display Co., Ltd. 2016 10.64 2884 E30481 Japan Display Co., Ltd. 2018734.39

Tous les ROE sont +, et il n'y a pas de données pour l'exercice 2017 en premier lieu.

La valeur change-t-elle, qu'elle soit concaténée ou unique?

Même ainsi, il est étrange qu'il n'y ait pas de ROE moins les entreprises.

à partir de maintenant

Étant donné que l'exactitude des données n'est pas bonne, aucune autre analyse ne sera effectuée pour le moment.

Le rapport RSE étant au format pdf, il faut plusieurs étapes à utiliser pour l'analyse.

Merci d'inclure le code edinet dans le nom du fichier (avec cela, il est facile de lier avec d'autres informations).

J'ai pensé essayer d'extraire des informations de l'utilisation des couleurs du rapport RSE, du nombre de photos, du nombre de caractères, etc., mais combien cela coûterait-il pour GCP?

Dans tous les cas, je ne sais pas si les données de performances à prendre en charge sont correctes, arrêtons donc l'analyse.

Veuillez me faire savoir s'il y a une erreur dans l'analyse.

Je ne pense pas qu'il y ait d'erreur uniquement pour TIS. .. ..

Recommended Posts
Jouons avec le jeu de données d'analyse d'entreprise "CoARiJ" créé par TIS ①

Jouons avec le jeu de données d'analyse d'entreprise "CoARiJ" créé par TIS ②

Jouez avec l'API de consommation d'énergie fournie par Yahoo

Analysons les données de l'enquête par questionnaire [4e: Analyse des émotions]

Regardons le diagramme de dispersion avant l'analyse des données

Visualisons les données pluviométriques publiées par la préfecture de Shimane

Analyse de données avec python 2

Analyse de données avec Python

Un diagramme de réseau a été créé avec les données du COVID-19.

Faisons l'analyse des données de naufrage du Titanic comme ça

Essayons l'analyse! ~ Data Scientist a également commencé à coder ~ Par Fringe81

Exemple de données créées avec python

Jouons avec la 4e dimension 4e

Jouons avec les données Amedas - Partie 1

Gzip compresser les données en streaming

Jouons avec les données Amedas - Partie 4

Jouons avec les données Amedas - Partie 3

Jouons avec les données Amedas - Partie 2

Visualisons les données de niveau d'eau de la rivière publiées par la préfecture de Shimane

Le premier débutant en programmation à essayer une analyse de données simple avec programmation

Préparez un environnement d'analyse haute vitesse en accédant à mysql depuis l'environnement d'analyse de données