Getting Started with Amazon Textract: Process Documents with Synchronous and Asynchronous Operations (Spanish from Latin America)
Offered By: Amazon Web Services via AWS Skill Builder
Course Description
Overview
Información general sobre el laboratorio
En este laboratorio se presentan flujos de trabajo diseñados para mostrar el uso del procesamiento inteligente de documentos (IDP) de Amazon Textract mediante constructos de Amazon Cloud Development Kit (CDK). El IDP permite un reconocimiento de texto en imágenes más preciso y detallado, mediante el uso de técnicas de preprocesamiento, como el filtrado, la reducción de ruido y otras técnicas de manipulación de imágenes que mejoran su calidad antes de ser procesadas. Amazon Textract es un servicio basado en la nube que extrae automáticamente texto y datos de documentos escaneados. Los constructos de CDK del IDP de Amazon Textract son un conjunto de patrones de código predefinidos para utilizar Amazon Textract e identificar y censurar información confidencial en documentos.
En este laboratorio, analizará los flujos de trabajo de SimpleSyncTextract y de SimpleAsyncTextract. SimpleSyncTextract y SimpleAsyncTextract son flujos de trabajo que proporciona Amazon Textract, un servicio de machine learning que extrae automáticamente el texto y los datos de documentos escaneados.
SimpleSyncTextract es una versión sincrónica del servicio que le permite analizar un documento y recibir el texto y los datos extraídos en la misma llamada API. Esto significa que su aplicación espera que se complete el análisis de Textract antes de continuar. SimpleAsyncTextract es una versión asincrónica del servicio que le permite analizar un documento y recibir el texto y los datos extraídos en una llamada API posterior. Esto significa que su aplicación puede seguir ejecutándose mientras se realiza el análisis de Textract. Esta versión permite un uso más eficiente de los recursos, ya que su aplicación puede seguir procesando otras solicitudes mientras espera que se complete el análisis de Textract.
Objetivos
Al final de este laboratorio, podrá hacer lo siguiente:
- Evaluar los constructos de CDK de Textract
- Analizar una imagen con el flujo de trabajo SimpleSyncWorkflow de Textract
- Analizar un documento con el flujo de trabajo SimpleAsyncWorkflow de Textract
Conocimientos técnicos previos necesarios
Para completar este laboratorio correctamente, se recomienda que esté familiarizado con lo siguiente:
- Utilizar un terminal de Linux
- Navegación básica de la consola de administración de AWS
- Cargar archivos a un bucket de Amazon Simple Storage Service (Amazon S3) con AWS CLI
Duración
Se estipula que completar el laboratorio llevará no más de 60 minutos.
Nota: El entorno del laboratorio demora aproximadamente 20 minutos en crearse por completo para poder acceder a él.
Significados de los íconos
A lo largo de este laboratorio, se utilizan varios íconos para llamar la atención sobre diferentes tipos de instrucciones y notas. En la siguiente lista, se explica el propósito de cada ícono:
- Comando: un comando que debe ejecutar.
- Resultado esperado: un resultado de muestra que puede utilizar para verificar el resultado de un comando o archivo editado.
- Nota: una pista, consejo u orientación importante.
- Información adicional: dónde encontrar más información.
Tags
Related Courses
Data Wrangling with MongoDBMongoDB via Udacity Data Science Essentials for SAP
OnSAP Academy via Independent Herramientas de la Inteligencia de Negocios
Galileo University via edX Digital Media Analytics: Using 'Listening Data'
Purdue University via FutureLearn Advanced Business Analytics
University of Colorado Boulder via Coursera