def gmain(self, d: DataSet) -> DataSet: """タスクの処理(Graphから呼び出す用) Args: d (DataSet): 入力DataSet Returns: DataSet: 出力DataSet """ self._in = {} # DataSet 自動展開 if d: for k in d.keys(): self._in[k] = d.get(k).content # 実行 start = time.time() r = self.main(d) self._elapsed_time = time.time() - start return r
ds = DataSet() ds.put("titanic", DataFrameData(df)) return ds if __name__ == "__main__": basicConfig(level=DEBUG) # データセットの読み込み ds = DataSet() repo = LocalFileRepository( Path(os.path.dirname(__file__)) / Path("../titanic.csv")) titanic_data = DataFrameData.load(repo) ds.put("titanic", titanic_data) # print("## Original data") print(ds.get("titanic").content) # Graphで処理する # Age欠損埋め -> 性別のコード化 -> 乗船した港 のコード化 の順で処理 graph = Graph() fill_age = graph.append(FillNaMedian("Age")) sex_to_code = graph.append(SexToCode(), [fill_age]) graph.append(EmbarkedToCode(), [sex_to_code]) ds = graph.run(ds) print("## Processed data") print(ds.get("titanic").content)