Automātiska dokumentu lauku noteikšana

Mūsu analizatori gudri atpazīst un automātiski nosaka unikālas lauka vērtības no augšupielādētajiem dokumentiem.

Dokumentu valodas atpazīšana

Noteikt skenēto vai drukāto dokumentu, attēlu un PDF failu valodu.

Optiskā rakstzīmju atpazīšana (OCR)

Konvertējiet skenētus vai drukātus dokumentus, tostarp attēlus un PDF failus, mašīnlasāmā tekstā.

Integrācija un automatizācija

Mūsu dokumentu analizatorus var integrēt esošās programmatūras sistēmās vai darba procesos.

Dokumentu valodas atpazīšanas API

Parse Documents ir spēcīgs API kopums, kas izstrādāts, lai atbilstu visām dokumentu analīzes prasībām. Mūsu mērķis ir vienkāršot sarežģīto dokumentu pārvaldības procesu neatkarīgi no tā, vai tā ir kļūdu meklēšana, analīze vai apstrāde. Tie ietver vienkāršu lapu šķirošanu, plašu atbalstīto dokumentu veidu klāstu un rūpīgu kļūdu ziņošanu.

Daudzpusība un elastība

Izmantojot mūsu dažādās API, jūs varat ne tikai lasīt augšupielādētos dokumentus, bet arī ievietot dokumentus rindā analīzei, izmantojot tiešu augšupielādi vai ārēju saiti. Mūsu API ir izstrādātas, ņemot vērā uzņēmējdarbības dinamisko raksturu, ļaujot tām nemanāmi pielāgoties dažādām biznesa vajadzībām un konfigurācijām.

Swagger konfigurācija

API ir kodētas saskaņā ar OpenAPI specifikāciju (OAS), padarot integrācijas procesu bez problēmām un vienkāršu. Mēs piedāvājam plašu dokumentāciju, kuras pamatā ir Swagger lietotāja interfeiss, kurā ir sīki aprakstītas iespējamās atbildes un iespējamie statusa un kļūdu kodi.

Jūsu drošība ir mūsu prioritāte

Visi API pieprasījumi tiek autentificēti, izmantojot JWT galvenes, lai nodrošinātu maksimālu drošību. Tas nodrošina, ka jūsu sensitīvie dokumenta dati vienmēr tiks aizsargāti.

Sāksim

Mēs priecājamies, ka esat pievienojies, un nevaram vien sagaidīt, kad varēsim redzēt, kā jūs integrēsit un maksimāli palielināsit Parse Documents priekšrocības savās dokumentu pārvaldības darbībās!

Noteikti aizstājiet "YourAuthTokenHere" ar faktisko nesēja pilnvaru.
Identify Document Languages
POST /v1/documents/languages

A POST method that identifies the languages of the provided document text. This method takes the document text as input and returns the identified languages along with their probabilities.

Example Request
POST /v1/documents/languages
Request Body
{
    "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
}
Responses
  • 200 Success: Returns the identified languages along with their probabilities.
  • 404 Not Found: The requested document is not found.
  • 400 Bad Request: The request was made incorrectly.
Here is the modified HTML template with the .NET example filled and rewritten for other programming languages:
import requests

url = "https://%(baseUrl)s/v1/documents/languages"
headers = {
    "Authorization": "Bearer {YOUR_API_KEY}"
}

payload = {
    "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
}

response = requests.post(url, headers=headers, json=payload)
response.raise_for_status()

identified_languages = response.json()

for lang in identified_languages:
    print(f"Language: {lang['code']} - Probability: {lang['probability']}")
        
package main

import (
    "fmt"
    "net/http"
    "bytes"
    "encoding/json"
)

func main() {
    identifyDocumentLanguages()
}

func identifyDocumentLanguages() {
    url := "https://%(baseUrl)s/v1/documents/languages"
    apiKey := "{YOUR_API_KEY}"

    payload := map[string]interface{}{
        "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit.",
    }

    requestBody, _ := json.Marshal(payload)
    req, _ := http.NewRequest("POST", url, bytes.NewBuffer(requestBody))
    req.Header.Set("Authorization", "Bearer "+apiKey)
    req.Header.Set("Content-Type", "application/json")

    client := &http.Client{}
    response, _ := client.Do(req)

    identifiedLanguages := []map[string]interface{}{}

    json.NewDecoder(response.Body).Decode(&identifiedLanguages)

    for _, lang := range identifiedLanguages {
        fmt.Printf("Language: %v - Probability: %v\n", lang["code"], lang["probability"])
    }
}
        
<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://%(baseUrl)s/v1/documents/languages",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_POST => true,
  CURLOPT_POSTFIELDS => json_encode([
    "text" => "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: Bearer {YOUR_API_KEY}",
    "Content-Type: application/json"
  ],
]);

$response = curl_exec($curl);
$error = curl_error($curl);

curl_close($curl);

if ($error) {
  echo "Error: " . $error;
} else {
  $identifiedLanguages = json_decode($response, true);

  foreach ($identifiedLanguages as $lang) {
    echo "Language: " . $lang['code'] . " - Probability: " . $lang['probability'] . "\n";
  }
}
using System;
using System.Net.Http;
using System.Text;
using System.Text.Json;
using System.Threading.Tasks;

class Program
{
    private static readonly HttpClient client = new HttpClient();
    private static readonly string BASE_URL = "{YOUR_API_BASE_URL}";
    private static readonly string API_KEY = "{YOUR_API_KEY}";

    static void Main(string[] args)
    {
        IdentifyDocumentLanguages().Wait();
    }

    private static async Task IdentifyDocumentLanguages()
    {
        try
        {
            client.DefaultRequestHeaders.Authorization = new System.Net.Http.Headers.AuthenticationHeaderValue("Bearer", API_KEY);

            var requestBody = new
            {
                text = "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
            };

            var requestContent = new StringContent(JsonSerializer.Serialize(requestBody), Encoding.UTF8, "application/json");

            var response = await client.PostAsync(BASE_URL + "/v1/documents/languages", requestContent);
            response.EnsureSuccessStatusCode();

            var responseBody = await response.Content.ReadAsStringAsync();
            var identifiedLanguages = JsonSerializer.Deserialize<IdentifyLanguage[]>(responseBody);

            foreach (var lang in identifiedLanguages)
            {
                Console.WriteLine($"Language: {lang.code} - Probability: {lang.probability}");
            }
        }
        catch (HttpRequestException e)
        {
            Console.WriteLine($"Error: {e.Message}");
        }
    }
}

In this code, we define a simple program with a single method `IdentifyDocumentLanguages`.

This method first sets up the authentication header by adding the bearer token to the HttpClient's default headers.

Then, it creates the request body containing the document text.

It sends a POST request to the specified endpoint with the request body as JSON.

If the request fails for any reason, an HttpRequestException will be thrown and the method will catch it and print the error message to the console.

If the request is successful, the method will read the response body as an array of `IdentifyLanguage` objects and print the language code and probability for each identified language.

Request Body:

  • text: The document text to identify the languages.

Parse Documents

Pārveidojiet savu dokumentu apstrādes procesu, izmantojot progresīvu, ar AI darbinātu datu ieguves sistēmu, kas palīdz pieņemt gudrākus lēmumus.