Пример #1
0
 def part_of_task_clusters_with_task_names(self, task_names):
     SUPERTYPE_NAME = constants.SUPERTYPE_NAME
     edge_finder = TaskGraphEdgeFinder(self.graph)
     task_clusters = {SUPERTYPE_NAME: []}  # {'SUPERTYPE': [{'a_b', 'c_d'}, {e_f, 'g_h'}]}
     # 高頻度の、subtypeでない、オリジナルのタスクの集合から、同じurlのものかentailment関係にあるものを見つける
     for task_name in task_names:
         task_names_list = edge_finder.part_of_edges_with_task_name(task_name)
         for task_names in task_names_list:
             task_cluster = TaskCluster(list(task_names))
             if task_cluster in task_clusters[SUPERTYPE_NAME]:  # 重複して数えているのを排除
                 continue
             if task_cluster:
                 if len(task_cluster) > 1:  # 1ページに1つだけタスク記述あるときはpart-ofでない
                     task_clusters[SUPERTYPE_NAME].append(task_cluster)
     return task_clusters
    def part_of_task_clusters(self):
        edge_finder = TaskGraphEdgeFinder(self.graph)
        task_clusters = []  # [{'a_b', 'c_d'}, {e_f, 'g_h'}]
        # オリジナルのタスクの集合から、同じurlのものを探す
        for task_name in self.candidate_tasks:
            task_names_list = edge_finder.part_of_edges_with_task_name(task_name)

            for task_names in task_names_list:
                task_cluster = TaskCluster(list(task_names))
                if task_cluster in task_clusters:  # 重複して数えているのを排除
                    continue
                if task_cluster:
                    if len(task_cluster) > 1:  # 1ページに1つだけタスク記述あるときはpart-ofでない
                        task_clusters.append(task_cluster)
        return task_clusters
Пример #3
0
    def part_of_task_clusters(self):
        edge_finder = TaskGraphEdgeFinder(self.graph)
        task_clusters = []  # [{'a_b', 'c_d'}, {e_f, 'g_h'}]
        # オリジナルのタスクの集合から、同じurlのものを探す
        for task_name in self.candidate_tasks:
            task_names_list = edge_finder.part_of_edges_with_task_name(
                task_name)

            for task_names in task_names_list:
                task_cluster = TaskCluster(list(task_names))
                if task_cluster in task_clusters:  # 重複して数えているのを排除
                    continue
                if task_cluster:
                    if len(task_cluster) > 1:  # 1ページに1つだけタスク記述あるときはpart-ofでない
                        task_clusters.append(task_cluster)
        return task_clusters