Deteksi otomatis bidang dokumen

Penganalisis kami secara cerdas mengenali dan secara otomatis mendeteksi nilai bidang unik dari dokumen yang diunggah.

Pengenalan bahasa dokumen

Deteksi bahasa dokumen, gambar, dan file PDF yang dipindai atau dicetak.

Pengenalan Karakter Optik (OCR)

Konversikan dokumen yang dipindai atau dicetak, termasuk gambar dan file PDF, menjadi teks yang dapat dibaca mesin.

Integrasi dan otomatisasi

Penganalisis dokumen kami dapat diintegrasikan ke dalam sistem perangkat lunak atau proses kerja yang ada.

API Pengenalan Bahasa Dokumen

Parse Documents adalah serangkaian API canggih yang dirancang untuk memenuhi semua persyaratan analisis dokumen. Tujuan kami adalah menyederhanakan proses kompleks dalam mengelola dokumen, baik itu pencarian, analisis, atau penanganan kesalahan. Ini termasuk penyortiran halaman yang mudah, beragam jenis dokumen yang didukung, dan pelaporan kesalahan menyeluruh.

Keserbagunaan dan fleksibilitas

Dengan menggunakan berbagai API kami, Anda tidak hanya dapat membaca dokumen yang diunggah, tetapi juga mengantri dokumen untuk dianalisis melalui unggahan langsung atau tautan eksternal. API kami dirancang dengan mempertimbangkan sifat bisnis yang dinamis, memungkinkannya mengakomodasi berbagai kebutuhan dan konfigurasi bisnis dengan lancar.

Konfigurasi angkuh

API diberi kode sesuai dengan Spesifikasi OpenAPI (OAS), membuat proses integrasi tidak repot dan sederhana. Kami menyediakan dokumentasi ekstensif berdasarkan antarmuka pengguna Swagger yang merinci kemungkinan respons serta kemungkinan status dan kode kesalahan.

Keamanan Anda adalah prioritas kami

Semua permintaan API diautentikasi menggunakan header JWT untuk keamanan maksimum. Hal ini memastikan bahwa data dokumen sensitif Anda akan selalu terlindungi.

Mari kita mulai

Kami sangat senang Anda bergabung dan tidak sabar untuk melihat bagaimana Anda mengintegrasikan dan memaksimalkan manfaat Parse Documents dalam operasi pengelolaan dokumen Anda!

Pastikan untuk mengganti "YourAuthTokenHere" dengan token pembawa yang sebenarnya.
Identify Document Languages
POST /v1/documents/languages

A POST method that identifies the languages of the provided document text. This method takes the document text as input and returns the identified languages along with their probabilities.

Example Request
POST /v1/documents/languages
Request Body
{
    "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
}
Responses
  • 200 Success: Returns the identified languages along with their probabilities.
  • 404 Not Found: The requested document is not found.
  • 400 Bad Request: The request was made incorrectly.
Here is the modified HTML template with the .NET example filled and rewritten for other programming languages:
import requests

url = "https://%(baseUrl)s/v1/documents/languages"
headers = {
    "Authorization": "Bearer {YOUR_API_KEY}"
}

payload = {
    "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
}

response = requests.post(url, headers=headers, json=payload)
response.raise_for_status()

identified_languages = response.json()

for lang in identified_languages:
    print(f"Language: {lang['code']} - Probability: {lang['probability']}")
        
package main

import (
    "fmt"
    "net/http"
    "bytes"
    "encoding/json"
)

func main() {
    identifyDocumentLanguages()
}

func identifyDocumentLanguages() {
    url := "https://%(baseUrl)s/v1/documents/languages"
    apiKey := "{YOUR_API_KEY}"

    payload := map[string]interface{}{
        "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit.",
    }

    requestBody, _ := json.Marshal(payload)
    req, _ := http.NewRequest("POST", url, bytes.NewBuffer(requestBody))
    req.Header.Set("Authorization", "Bearer "+apiKey)
    req.Header.Set("Content-Type", "application/json")

    client := &http.Client{}
    response, _ := client.Do(req)

    identifiedLanguages := []map[string]interface{}{}

    json.NewDecoder(response.Body).Decode(&identifiedLanguages)

    for _, lang := range identifiedLanguages {
        fmt.Printf("Language: %v - Probability: %v\n", lang["code"], lang["probability"])
    }
}
        
<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://%(baseUrl)s/v1/documents/languages",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_POST => true,
  CURLOPT_POSTFIELDS => json_encode([
    "text" => "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: Bearer {YOUR_API_KEY}",
    "Content-Type: application/json"
  ],
]);

$response = curl_exec($curl);
$error = curl_error($curl);

curl_close($curl);

if ($error) {
  echo "Error: " . $error;
} else {
  $identifiedLanguages = json_decode($response, true);

  foreach ($identifiedLanguages as $lang) {
    echo "Language: " . $lang['code'] . " - Probability: " . $lang['probability'] . "\n";
  }
}
using System;
using System.Net.Http;
using System.Text;
using System.Text.Json;
using System.Threading.Tasks;

class Program
{
    private static readonly HttpClient client = new HttpClient();
    private static readonly string BASE_URL = "{YOUR_API_BASE_URL}";
    private static readonly string API_KEY = "{YOUR_API_KEY}";

    static void Main(string[] args)
    {
        IdentifyDocumentLanguages().Wait();
    }

    private static async Task IdentifyDocumentLanguages()
    {
        try
        {
            client.DefaultRequestHeaders.Authorization = new System.Net.Http.Headers.AuthenticationHeaderValue("Bearer", API_KEY);

            var requestBody = new
            {
                text = "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
            };

            var requestContent = new StringContent(JsonSerializer.Serialize(requestBody), Encoding.UTF8, "application/json");

            var response = await client.PostAsync(BASE_URL + "/v1/documents/languages", requestContent);
            response.EnsureSuccessStatusCode();

            var responseBody = await response.Content.ReadAsStringAsync();
            var identifiedLanguages = JsonSerializer.Deserialize<IdentifyLanguage[]>(responseBody);

            foreach (var lang in identifiedLanguages)
            {
                Console.WriteLine($"Language: {lang.code} - Probability: {lang.probability}");
            }
        }
        catch (HttpRequestException e)
        {
            Console.WriteLine($"Error: {e.Message}");
        }
    }
}

In this code, we define a simple program with a single method `IdentifyDocumentLanguages`.

This method first sets up the authentication header by adding the bearer token to the HttpClient's default headers.

Then, it creates the request body containing the document text.

It sends a POST request to the specified endpoint with the request body as JSON.

If the request fails for any reason, an HttpRequestException will be thrown and the method will catch it and print the error message to the console.

If the request is successful, the method will read the response body as an array of `IdentifyLanguage` objects and print the language code and probability for each identified language.

Request Body:

  • text: The document text to identify the languages.

Parse Documents

Ubah proses pemrosesan dokumen Anda dengan sistem ekstraksi data canggih yang didukung AI yang membantu Anda mengambil keputusan lebih cerdas.