Python ElasticCore.get 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: texta_elastic.core

클래스/타입: ElasticCore

메소드/함수: get

hotexamples.com에서의 예제들: 4

Python ElasticCore.get - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 texta_elastic.core.ElasticCore.get에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

ElasticCore(30)

delete_index(17)

add_texta_facts_mapping(6)

flatten(6)

check_if_indices_exist(5)

get(4)

get_fields(4)

create_index(3)

get_index_stats(2)

close_index(2)

get_version(2)

scroll(1)

open_index(1)

get_skipped_annotation_query(1)

get_annotated_annotation_query(1)

get_index_settings(1)

get_index_creation_date(1)

get_annotation_query(1)

add_annotator_mapping(1)

add_texta_meta_mapping(1)

syncher(1)

예제 #1

파일 보기

파일: views.py 프로젝트: EMBEDDIA/texta-rest

    def tag_doc(self, request, pk=None, project_pk=None):
        serializer = RegexTaggerGroupTagDocumentSerializer(data=request.data)
        serializer.is_valid(raise_exception=True)
        tagger_object: RegexTagger = self.get_object()

        input_document = serializer.validated_data["doc"]
        fields = serializer.validated_data["fields"]

        # apply tagger
        results = {
            "tagger_id": tagger_object.pk,
            "tag": tagger_object.description,
            "result": False,
            "matches": []
        }
        final_matches = []
        for field in fields:

            flattened_doc = ElasticCore(
                check_connection=False).flatten(input_document)
            text = flattened_doc.get(field, None)
            matches = tagger_object.match_texts([text], as_texta_facts=False)

            if matches:
                for match in matches:
                    match.update(field=field)
                final_matches.extend(matches)
                results["result"] = True

        results["matches"] = final_matches

        return Response(results, status=status.HTTP_200_OK)

예제 #2

파일 보기

파일: views.py 프로젝트: EMBEDDIA/texta-rest

    def tag_random_doc(self, request, pk=None, project_pk=None):
        """Returns prediction for a random document in Elasticsearch."""
        # get tagger object
        tagger_object: RegexTaggerGroup = self.get_object()

        serializer = TagRandomDocSerializer(data=request.data)
        serializer.is_valid(raise_exception=True)

        project_object = Project.objects.get(pk=project_pk)
        indices = [
            index["name"] for index in serializer.validated_data["indices"]
        ]
        indices = project_object.get_available_or_all_project_indices(indices)

        # retrieve tagger fields
        fields = serializer.validated_data["fields"]
        if not ElasticCore().check_if_indices_exist(
                tagger_object.project.get_indices()):
            return Response(
                {
                    'error':
                    f'One or more index from {list(tagger_object.project.get_indices())} do not exist'
                },
                status=status.HTTP_400_BAD_REQUEST)

        # retrieve random document
        random_doc = ElasticSearcher(indices=indices).random_documents(
            size=1)[0]
        flattened_doc = ElasticCore(check_connection=False).flatten(random_doc)

        # apply tagger
        results = {
            "tagger_group_id": tagger_object.pk,
            "tagger_group_tag": tagger_object.description,
            "result": False,
            "matches": [],
            "document": flattened_doc
        }

        final_matches = []
        for field in fields:
            text = flattened_doc.get(field, None)
            results["document"][field] = text
            matches = tagger_object.match_texts([text],
                                                as_texta_facts=True,
                                                field=field)

            if matches:
                final_matches.extend(matches)
                results["result"] = True

        results["matches"] = final_matches

        return Response(results, status=status.HTTP_200_OK)

예제 #3

파일 보기

    def extract_from_random_doc(self, request, pk=None, project_pk=None):
        """Returns prediction for a random document in Elasticsearch."""
        # get rakun object
        rakun_object: RakunExtractor = RakunExtractor.objects.get(pk=pk)

        serializer = RakunExtractorRandomDocSerializer(data=request.data)
        serializer.is_valid(raise_exception=True)

        project_object = Project.objects.get(pk=project_pk)
        indices = [index["name"] for index in serializer.validated_data["indices"]]
        indices = project_object.get_available_or_all_project_indices(indices)

        # retrieve rakun fields
        fields = serializer.validated_data["fields"]

        # retrieve param add_spans
        add_spans = serializer.validated_data["add_spans"]

        # retrieve random document
        random_doc = ElasticSearcher(indices=indices).random_documents(size=1)[0]
        flattened_doc = ElasticCore(check_connection=False).flatten(random_doc)

        # apply rakun
        results = {
            "rakun_id": rakun_object.pk,
            "description": rakun_object.description,
            "result": False,
            "keywords": [],
            "document": flattened_doc
        }
        final_keywords = []
        keyword_detector = rakun_object.load_rakun_keyword_detector()
        for field in fields:
            text = flattened_doc.get(field, "")
            results["document"][field] = text
            keywords = rakun_object.get_rakun_keywords(keyword_detector=keyword_detector, texts=[text], field_path=field, fact_name=rakun_object.description, fact_value="", add_spans=add_spans)

            if keywords:
                final_keywords.extend(keywords)
                results["result"] = True

        results["keywords"] = final_keywords
        return Response(results, status=status.HTTP_200_OK)

예제 #4

파일 보기

    def tag_docs(self, fields: List[str], docs: List[dict]):
        # apply tagger
        for doc in docs:
            for field in fields:
                flattened_doc = ElasticCore(
                    check_connection=False).flatten(doc)
                text = flattened_doc.get(field, None)
                matches_as_facts = self.match_texts([text],
                                                    as_texta_facts=True,
                                                    field=field)
                for fact in matches_as_facts:
                    fact.update(fact=self.description)

                pre_existing_facts = doc.get(TEXTA_TAGS_KEY, [])
                filtered_facts = ElasticDocument.remove_duplicate_facts(
                    pre_existing_facts + matches_as_facts)
                doc[TEXTA_TAGS_KEY] = filtered_facts

        return docs