인공 지능 개발 현황 및 동향에 대해서 알아본 결과에 대해서 알아본다.

    프레임 워크에 포함된 AI 관련 기술을 기반으로 이 섹션에서는 지난 20 년 동안 기계 학습, 지식 그래프, 자연어 처리, 컴퓨터 비전, 인간-컴퓨터 상호 작용 및 생물학적 특성을 포함한 인공 지능 분야의 핵심 기술 개발에 중점을 둡니다.

     

    3.1 인공 지능의 핵심 기술

    3.1.1 기계 학습

    기계 학습은 통계, 시스템 식별, 근사 이론, 신경망, 최적화 이론, 컴퓨터 과학, 뇌 과학 및 기타 여러 분야를 포함하는 학제 간 과목입니다. 컴퓨터가 인간의 학습 행동을 시뮬레이션하거나 실현하는 방법을 연구합니다. 새로운 지식 또는 기술, 기존 지식 구조를 재구성하여 자체 성능을 지속적으로 향상하는 것은 인공 지능 기술의 핵심입니다.

     

    (1) 학습 모드에 따라 기계 학습은 지도 학습, 비지도 학습, 강화 학습으로 구분됩니다.

    지도 학습

    지도 학습은 라벨링 (분류) / 새 데이터 / 인스턴스 매핑을 실현하기 위해 특정 학습 전략 / 방법을 통해 모델을 설정하기 위해 제한된 라벨링 된 학습 데이터 세트를 사용하는 것입니다. 가장 일반적인 지도 학습 알고리즘에는 회귀 및 분류가 포함됩니다. 지도 학습에서는 학습 샘플의 분류 라벨을 알고 있어야 합니다. 분류 라벨의 정확도가 높을수록 샘플의 대표성이 높고 학습 모델의 정확도가 높아집니다. 지도 학습은 자연어 처리, 정보 검색, 텍스트 마이닝, 필기 인식 및 스팸 감지와 같은 분야에서 널리 사용되었습니다.

     

    비지도 학습

    비지도 학습은 레이블이 지정되지 않은 제한된 데이터를 사용하여 레이블이 없는 데이터에 숨겨진 구조 / 규칙을 설명합니다. 가장 일반적인 비지도 학습 알고리즘에는 단일 클래스 밀도 추정, 단일 클래스 데이터 차원 축소 및 클러스터링이 포함됩니다. 비지도 학습에는 훈련 샘플과 수동으로 레이블이 지정된 데이터가 필요하지 않으므로 데이터 저장 압축, 계산 감소, 알고리즘 속도 개선, 양수 및 음수 샘플 오프셋으로 인한 분류 오류 방지에 편리합니다. 주로 경제 예측, 이상 탐지, 데이터 마이닝, 이미지 처리, 패턴 인식 및 대규모 컴퓨터 클러스터 구성, 소셜 네트워크 분석, 시장 세분화, 천문 데이터 분석 등과 같은 기타 분야에서 사용됩니다.

     

    강화 학습

    강화 학습은 강화 신호 기능의 가치를 극대화하기 위해 환경에서 행동 매핑까지 지능형 시스템을 학습하는 것입니다. 외부 환경은 정보를 거의 제공하지 않기 때문에 강화 학습 시스템은 자체 경험을 통해 학습해야 합니다. 강화 학습의 목표는 환경 상태에서 행동으로의 매핑을 학습하여 에이전트가 선택한 행동이 환경에서 가장 큰 보상을 받을 수 있고 외부 환경이 특정 의미에서 학습 시스템을 가장 잘 평가할 수 있도록 하는 것입니다. 로봇 제어, 무인 운전, 체스, 산업 제어 및 기타 분야에 성공적으로 적용되었습니다.

     

    (2) 학습 방법에 따라 기계 학습은 전통적인 기계 학습과 딥 러닝으로 나눌 수 있습니다.

    전통적인 기계 학습

    전통적인 기계 학습은 일부 관찰 (훈련) 샘플에서 시작하여 원리 분석을 통해 얻을 수없는 법칙을 발견하고 미래의 데이터 행동이나 추세에 대한 정확한 예측을 실현하려고 합니다. 관련 알고리즘에는 로지스틱 회귀, 은닉 마르코프 방법, 서포트 벡터 머신 방법, K 최근 접 이웃 방법, 3 계층 인공 신경망 방법, Adaboost 알고리즘, 베이지안 방법 및 결정 트리 방법이 포함됩니다. 전통적인 기계 학습은 학습 결과의 효율성과 학습 모델의 해석 가능성의 균형을 맞추고 제한된 샘플로 학습 문제를 해결하기 위한 프레임 워크를 제공합니다. 주로 제한된 샘플의 경우 패턴 분류, 회귀 분석 및 확률 밀도 추정에 사용됩니다. 전통적인 기계 학습 방법에 공통된 중요한 이론적 기초 중 하나는 통계이며, 이는 자연어 처리, 음성 인식, 이미지 인식, 정보 검색 및 생물학적 정보와 같은 많은 컴퓨터 분야에서 널리 사용되었습니다.

     

    딥 러닝

    딥 러닝은 딥 구조 모델을 구축하기 위한 학습 방법입니다. 일반적인 딥 러닝 알고리즘에는 딥 신념 네트워크, 킨볼 루션 신경망, 제한된 볼츠만 머신 및 반복 신경망이 포함됩니다. 심층 학습은 심층 신경망이라고도 합니다 (3 개 이상의 계층이 있는 신경망을 나타냄). 기계 학습 연구의 새로운 분야 인 딥 러닝은 2006 년 Hinton 등이 제안했습니다. 딥 러닝은 다층 신경망에서 시작되며 그 본질은 특징 표현과 학습을 결합하는 방법을 제공하는 것입니다. 딥 러닝의 특징은 해석 성을 포기하고 단순히 학습의 효과를 추구하는 것입니다. 수년간의 실험과 연구 끝에 많은 심층 신경망 모델이 만들어졌는데 그중 컨볼 루션 신경망과 순환 신경망이 대표적인 모델입니다. 컨볼 루션 신경망은 종종 공간적으로 분산된 데이터에 적용됩니다. 순환 신경망은 메모리와 피드백을 신경망에 도입하고 종종 시간적으로 분산된 데이터에 적용됩니다. 딥 러닝 프레임 워크는 딥 러닝을 위한 기본 프레임 워크입니다. 일반적으로 주류 신경망 알고리즘 모델을 포함하고 안정적인 딥 러닝 API를 제공하며 서버, GPU 및 TPU 간의 학습 모델에 대한 분산 학습을 지원합니다. 일부 프레임 워크에는 모바일도 포함됩니다. 장비 및 클라우드 플랫폼을 포함한 여러 플랫폼에서 실행되는 이식성은 딥 러닝 알고리즘에 전례 없는 운영 속도와 실용성을 제공합니다. 현재 주류 오픈 소스 알고리즘 프레임 워크에는 Tensor Flow, Caffe / Caffe2, CNTK, MXNet, Paddle-paddle, Torch / PyTorch, Theano 등이 포함됩니다.

     

    (3) 또한 기계 학습을 위한 일반적인 알고리ㅁ즘에는 전이 학습, 능동 학습 및 진화 학습도 포함됩니다.

    전이 학습

    전이 학습은 일부 분야에서 모델 학습을 위한 충분한 데이터를 얻을 수 없을 때 다른 분야의 데이터에서 얻은 관계를 사용하는 학습을 말합니다. 마이그레이션 학습은 학습된 모델 매개 변수를 새 모델로 전송하여 새 모델 학습을 안내할 수 있으며, 이를 통해 기본 규칙을 보다 효과적으로 학습하고 데이터 양을 줄일 수 있습니다.

     

    능동적 학습

    능동적 학습은 특정 알고리즘을 사용하여 가장 유용한 레이블이 지정되지 않은 샘플을 쿼리하고 레이블링을 위해 전문가에게 전달한 다음 쿼리 된 샘플을 사용하여 분류 모델을 훈련시켜 모델의 정확도를 향상합니다. 능동적 학습은 더 적은 수의 훈련 샘플을 통해 선택적으로 지식을 습득하고 고성능 모델을 얻을 수 있으며 가장 일반적으로 사용되는 전략은 불확실성과 차이 기준을 통해 효과적인 샘플을 선택하는 것입니다.

     

    진화 학습

    진화 학습은 최적화 문제의 특성에 대한 요구 사항이 거의 없으며 설루션의 품질만 평가할 수 있으면 됩니다. 복잡한 최적화 문제를 해결하는 데 적합하며 다목적 최적화에도 직접 사용할 수 있습니다. 진화 알고리즘에는 입자 떼 최적화 알고리즘과 다목적 진화 알고리즘이 포함됩니다. 진화 학습에 대한 현재의 연구는 주로 진화 데이터 클러스터링, 진화 데이터의 보다 효과적인 분류, 진화 메커니즘의 영향을 결정하기 위한 특정 적응 메커니즘 제공에 중점을 둡니다.

     

    3.1.2 지식 정보

    지식 그래프는 본질적으로 구조화된 의미 지식 기반입니다. 노드와 에지로 구성된 그래프 데이터 구조입니다. 물리적 세계에서 개념과 관계를 기호 형식으로 설명합니다. 기본 단위는 "엔티티-관계-엔티티"입니다. "트리플, 엔티티 및 관련"속성-값 "쌍. 서로 다른 엔티티는 관계를 통해 서로 연결되어 네트워크로 연결된 지식 구조를 형성합니다. 지식 그래프에서 각 노드는 실제 세계의 "엔티티"를 나타내고 각 에지는 엔터티와 엔터티 간의 "관계"입니다. 평신도의 관점에서 지식 맵은 모든 다른 유형의 정보를 함께 연결하여 얻은 관계형 네트워크로서 "관계"관점에서 문제를 분석할 수 있는 능력을 제공합니다. 지식 그래프는 사기 방지, 불일치 검증, 집단 사기 및 기타 공안 보호 분야에서 사용할 수 있으며 비정상 분석, 정적 분석, 동적 분석과 같은 데이터 마이닝 방법이 필요합니다. 특히 지식 그래프는 검색 엔진, 비주얼 디스플레이, 정밀 마케팅에서 큰 장점을 가지고 있으며 업계에서 인기 있는 도구가 되었습니다. 그러나 지식 그래프의 개발에는 데이터 노이즈 문제, 즉 데이터 자체에 오류가 있거나 데이터가 중복되는 등 여전히 큰 과제가 있습니다. 지식 그래프의 적용이 계속 심화됨에 따라 돌파구가 필요한 일련의 핵심 기술이 여전히 있습니다.

     

    3.1.3 자연어 처리

    자연어 처리는 컴퓨터 과학 및 인공 지능 분야에서 중요한 방향으로, 자연어로 인간과 컴퓨터 간의 효과적인 의사소통을 실현할 수 있는 다양한 이론과 방법을 연구합니다. 주로 기계 번역과 기계를 비롯한 많은 분야를 포함합니다. (독해 및 질의응답 시스템 등)

     

    (1) 기계 번역

    기계 번역 기술은 컴퓨터 기술을 사용하여 하나의 자연어에서 다른 언어로의 번역 프로세스를 실현하는 것을 말합니다. 통계 기반의 기계 번역 방법은 기존의 규칙 기반 및 예제 기반 번역 방법의 한계를 극복하고 번역 성능이 크게 향상되었습니다. 일상적인 언어와 같은 일부 장면에서 심층 신경망을 기반으로 한 기계 번역의 성공적인 적용은 큰 잠재력을 보여주었습니다. 문맥의 문맥 표현의 개발과 지식 논리 추론 능력의 개발로 자연어 지식 그래프는 계속 확장되고 기계 번역은 다자간 대화 번역 및 텍스트 번역 분야에서 더 큰 진전을 이룰 것입니다. 현재 제한 없는 현장 기계 번역에서 더 나은 성능 중 하나는 두 단계의 훈련 및 디코딩을 포함하는 통계 기계 번역입니다. 훈련 단계의 목표는 모델 매개 변수를 얻는 것이며 디코딩 단계의 목표는 추정된 매개 변수와 주어진 최적화 목표를 사용하여 번역할 문장의 최상의 번역 결과를 얻는 것입니다. 통계적 기계 번역에는 주로 말뭉치 전처리, 단어 정렬, 구문 추출, 구문 확률 계산 및 최대 엔트로피 조정 단계가 포함됩니다. 신경망 기반의 end-to-end 번역 방법은 이중 언어 문장에 대한 특징 모델을 특별히 설계할 필요가 없고 원어 문장의 단어 문자열을 신경망 모델로 직접 전송합니다. 신경망 운영 후 목표 언어 문장의 번역 결과를 얻습니다. end-to-end 기계 번역 시스템에서는 일반적으로 반복 신경망 또는 컨볼 루션 신경망을 사용하여 문장을 표현하고 모델링하며 방대한 훈련 데이터에서 의미 정보를 추출합니다. 구문 기반 통계 번역에 비해 번역 결과가 더 원활합니다. 당연히 실제 적용에서 더 나은 결과를 얻었습니다.

     

    (2) 의미 이해

    의미 론적 이해 기술은 텍스트의 이해를 실현하고 텍스트와 관련된 질문에 답하기 위해 컴퓨터 기술을 사용하는 과정을 말합니다. 의미 론적 이해는 콘텍스트의 이해와 답변의 정확성 제어에 더 많은 주의를 기울입니다. MCTest 데이터 세트의 출시와 함께 의미 론적 이해에 더 많은 관심을 기울였고 빠른 개발이 이루어졌으며 관련 데이터 세트와 해당 신경망 모델이 끊임없이 등장하고 있습니다. 의미 이해 기술은 지능형 고객 서비스 및 제품 자동 질문 응답과 같은 관련 분야에서 중요한 역할을 할 것이며 질문 응답 및 대화 시스템의 정확성을 더욱 향상할 것입니다. 데이터 수집 측면에서 의미 론적 이해는 데이터를 자동으로 구성하고 빈칸 채우기 질문을 자동으로 구성하여 데이터 리소스를 효과적으로 확장합니다. 채우기 문제를 해결하기 위해 주의 기반 신경망 방법과 같은 딥 러닝 기반의 방법이 제안되었습니다. 현재 주류 모델은 신경망 기술을 사용하여 장과 질문을 모델링하고 답변의 시작 및 끝 위치를 예측하며 장 조각을 추출합니다. 더 일반화된 답변의 경우 처리 난이도가 더욱 높아지고 현재의 의미 이해 기술은 여전히 ​​개선의 여지가 많습니다.

     

    (3) 질문 응답 시스템

    질문 응답 시스템은 오픈 필드 대화 시스템과 특정 필드 질문 응답 시스템으로 구분됩니다. 질문 응답 시스템 기술은 컴퓨터가 인간과 같은 자연어로 사람들과 통신할 수 있도록 하는 기술을 말합니다. 사람들은 자연어로 표현된 질문을 질의응답 시스템에 제출할 수 있으며 시스템은 관련성이 더 높은 답변을 반환합니다. 질의응답 시스템을위한 응용 제품이 많았지 만, 대부분이 실제 정보 서비스 시스템과 스마트 폰 도우미 분야에 적용되고 있으며, 질의 응답 시스템의 견고성에는 여전히 문제와 과제가 있습니다.

    자연어 처리는 네 가지 주요 과제에 직면합니다. 첫째, 다양한 수준의 형태, 구문, 의미론, 실용 학 및 음성학에 불확실성이 있으며, 둘째, 새로운 어휘, 용어, 의미론 및 문법이 알려지지 않은 언어 현상을 예측할 수 없게 만듭니다. 데이터 리소스가 부족하면 복잡한 언어 현상을 다루기가 어렵습니다. 넷째, 의미 론적 지식의 모호함과 복잡한 관련성은 간단한 수학적 모델로 설명하기 어렵고 의미 론적 계산에는 큰 매개 변수가 있는 비선형 계산이 필요합니다.

     

    3.1.4 인간-컴퓨터 상호 작용

    인간-컴퓨터 상호 작용은 인간에서 컴퓨터로, 컴퓨터에서 인간으로의 정보 교환의 두 부분을 포함하여 인간과 컴퓨터 간의 정보 교환을 주로 연구하며 인공 지능 분야에서 중요한 주변 기술입니다. 인간-컴퓨터 상호 작용은인지 심리학, 인체 공학, 멀티미디어 기술 및 가상 현실 기술과 밀접하게 관련된 포괄적 인 분야입니다. 인간과 컴퓨터 간의 전통적인 정보 교환은 주로 키보드, 마우스, 조이스틱, 데이터 의류, 시선 추적기, 위치 추적기, 데이터 장갑, 압력 펜 및 기타 입력 장치, 프린터 및 그래픽을 포함한 대화 형 장치에 의존합니다. 악기, 디스플레이, 헬멧 장착 디스플레이, 스피커 등과 같은 출력 장치 인간-컴퓨터 상호 작용 기술은 기존의 기본 상호 작용 및 그래픽 상호 작용 외에도 음성 상호 작용, 정서적 상호 작용, 체성 감각 상호 작용, 뇌-컴퓨터 상호 작용 등의 기술을 포함하고 있으며, 인공 지능과 밀접하게 관련된 다음 4 가지 일반적인 상호 작용 방법을 소개합니다.

     

    (1) 음성 상호 작용

    음성 상호 작용은 효율적인 상호 작용 방법으로, 언어학, 심리학, 공학 및 컴퓨터 기술에 대한 지식을 결합하여 자연어 또는 기계 합성 음성을 통해 사람들이 컴퓨터와 상호 작용하는 포괄적 인 기술입니다. 음성 상호 작용은 음성 인식 및 음성 합성을 연구 할뿐만 아니라 음성 채널에서 인간 상호 작용 메커니즘과 행동을 연구해야합니다. 음성 상호 작용 프로세스는 음성 수집, 음성 인식, 의미 이해 및 음성 합성의 네 부분으로 구성됩니다. 음성 수집은 오디오의 입력, 샘플링 및 인코딩을 완료합니다. 음성 인식은 음성 정보를 기계 인식 가능한 텍스트 정보로 변환을 완료합니다. 의미 론적 이해는 음성 인식으로 변환 된 텍스트 문자 또는 명령에 따라 해당 작업을 완료합니다. 음성 합성은 텍스트 정보를 소리로 완성합니다. 정보 변환. 인간이 의사 소통하고 정보를 얻는 가장 자연스럽고 편리한 방법 인 음성 인식은 다른 상호 작용 방식에 비해 장점이 많고 인간과 컴퓨터의 상호 작용에 근본적인 변화를 가져올 수있다. 빅 데이터와 코 그너 티브 컴퓨팅 시대의 미래 발전의 절정이며 폭 넓은 발전을 이루고있다.

     

    (2) 정서적 상호 작용

    감정은 높은 수준의 정보 전달이고, 감정적 상호 작용은 기능과 정보를 표현할 때 감정을 전달하고 사람들의 기억이나 내면의 감정을 불러 일으키는 상호 작용의 상태입니다. 전통적인 인간-컴퓨터 상호 작용은 인간의 감정이나 기분을 이해하고 적응할 수 없으며, 감정을 이해하고 표현하는 능력이 부족합니다. 컴퓨터가 인간과 동일한 지능을 갖기 어렵고 컴퓨터가 인간-컴퓨터 상호 작용을 통해 진정한 조화와 자연을 이루기 어렵습니다. 정서적 상호 작용은 컴퓨터가 인간과 유사한 다양한 감정을 관찰, 이해 및 생성 할 수있는 능력을 부여하고 궁극적으로 컴퓨터가 인간처럼 자연스럽고 친절하며 생생하게 상호 작용할 수 있도록하는 것입니다. 인간과 컴퓨터의 상호 작용을보다 자연스럽게 만드는 것을 목표로하는 정서적 상호 작용은 인공 지능 분야에서 뜨거운 방향이되었습니다.

     

    (3) 체성 감각 상호 작용

    체성 감각 상호 작용은 개인이 체성 감각 기술을 기반으로하는 복잡한 제어 시스템에 의존 할 필요가 없으며 신체 움직임을 통해 주변 디지털 장비 및 환경과 직접 상호 작용할 필요가 없음을 의미합니다. 다양한 체성 감각 방법과 원리에 따라 체성 감각 기술은 주로 관성 감지, 광학 감지 및 광학 결합 감지의 세 가지 범주로 나뉩니다. 체성 감각 상호 작용은 일반적으로 동작 추적, 제스처 인식, 동작 캡처 및 표정 인식과 같은 일련의 기술에 의해 지원됩니다. 다른 인터랙티브 방식에 비해 체성 감각 인터랙션 기술은 하드웨어와 소프트웨어 측면에서 크게 향상되었으며, 소형화, 휴대 성, 사용 편의성 측면에서 인터랙티브 장치의 개발은 사용자의 제약을 크게 줄이고 상호 작용을 가능하게합니다. 그 과정은 더 자연 스럽습니다.

     

    (4) 뇌-컴퓨터 상호 작용

    뇌-컴퓨터 인터페이스라고도하는 뇌-컴퓨터 상호 작용은 말초 신경과 근육에 의존하지 않고 뇌와 외부 세계 간의 정보 전달을 직접 실현하는 경로를 말합니다. 뇌-컴퓨터 인터페이스 시스템은 중추 신경계의 활동을 감지하고이를 인공적인 출력 명령으로 변환하여 중추 신경계의 정상적인 출력을 대체, 복구, 향상, 보완 또는 개선하여 중추 신경계와 내부 및 외부 환경 간의 상호 작용을 변화시킵니다. 뇌-컴퓨터 상호 작용은 신경 신호를 디코딩하여 뇌 신호를 기계 명령으로 변환하는 것을 실현하며 일반적으로 신호 획득, 특징 추출 및 명령 출력의 세 가지 모듈을 포함합니다. 뇌파 신호 획득의 관점에서 뇌-컴퓨터 인터페이스는 일반적으로 침습적 및 비 침습적 두 가지 범주로 나뉩니다.

     

    3.1.5 컴퓨터 비전

    컴퓨터 비전은 컴퓨터를 사용하여 인간의 시각 시스템을 모방하는 과학으로, 컴퓨터에 인간과 유사한 이미지 및 이미지 시퀀스를 추출, 처리, 이해 및 분석 할 수있는 능력을 부여합니다. 자율 주행, 로봇 공학, 지능형 의료 및 기타 분야에서는 시각 신호에서 정보를 추출하고 처리하기 위해 컴퓨터 비전 기술이 필요합니다. 최근 딥 러닝이 발전함에 따라 전처리, 특징 추출 및 알고리즘 처리가 점차 통합되어 엔드 투 엔드 인공 지능 알고리즘 기술을 형성했습니다. 해결해야 할 문제에 따라 컴퓨터 비전은 컴퓨팅 이미징, 이미지 이해, 3 차원 비전, 동적 비전, 비디오 코덱의 다섯 가지 범주로 나눌 수 있습니다.

     

    (1) 컴퓨터 이미징

    컴퓨터 이미징은 인간의 눈의 구조, 카메라 이미징의 원리 및 확장 된 응용 분야를 탐구하는 과학입니다. 카메라 이미징 원리 측면에서 컴퓨터 이미징은 기존 가시 광선 카메라의 개선을 지속적으로 촉진하여 최신 카메라를 더욱 휴대 가능하고 다양한 시나리오에 적합하게 만듭니다. 동시에, 컴퓨터 이미징은 새로운 카메라의 생성을 주도하여 가시광 선의 한계를 넘어 섰습니다.

     

    (2) 이미지 이해

    이미지 이해는 컴퓨터 시스템으로 이미지를 해석하여 인간의 시각 시스템과 유사한 외부 세계에 대한 이해를 실현하는 과학입니다. 일반적으로 이해 정보의 추상화 정도에 따라 이미지 가장자리, 이미지 특징점, 텍스처 요소 등을 포함한 얕은 수준의 이해, 물체 경계, 영역 및 평면 등을 포함한 중간 수준의 이해, 필요에 따라 높은 수준의 이해, 높은 수준의 추출로 나눌 수 있습니다. 의미 론적 정보는 크게 인식, 감지, 분할, 포즈 추정, 이미지 텍스트 설명 등으로 나눌 수 있습니다.

     

    (3) 입체 비전

    3 차원 비전은 비전을 통해 3 차원 정보를 얻는 방법 (3 차원 재구성)과 획득 한 3 차원 정보를 이해하는 방법에 대한 과학입니다. 3 차원 복원은 복원의 정보원에 따라 단안 영상 복원, 다안 영상 복원, 깊이 영상 복원으로 나눌 수있다. 3 차원 정보 이해, 즉 3 차원 정보를 이미지 이해를 돕거나 3 차원 정보에 대한 직접적인 이해를 돕기 위해 3 차원 정보를 사용합니다. 3 차원 정보 이해는 모서리, 가장자리, 법선 벡터 등의 얕은 계층, 중간 계층 : 평면, 큐브 등, 상위 계층 : 물체 감지, 인식, 분할 등으로 나눌 수 있습니다. 3 차원 비전 기술은 로봇 공학, 무인 운전, 스마트 공장, 가상 / 증강 현실 및 기타 방향에서 널리 사용될 수 있습니다.

     

    (4) 다이나믹 비전

    동적 비전은 비디오 또는 이미지 시퀀스의 분석으로 시계열 이미지 처리 과학을 시뮬레이션합니다. 일반적으로 동적 시각 문제는 픽셀, 영역 및 객체와 같은 이미지 요소를 시간 순서대로 찾고 의미 정보를 추출하는 문제로 정의 할 수 있습니다. 동적 비전 연구는 비디오 분석 및 인간-컴퓨터 상호 작용에 널리 사용됩니다.

     

    (5) 비디오 코덱

    비디오 코덱은 특정 압축 기술을 통해 비디오 스트림을 압축하는 것을 말합니다. 비디오 스트리밍을위한 가장 중요한 코딩 및 디코딩 표준은 H.261, H.263, H.264, H.265, M-JPEG 및 ITU의 MPEG 시리즈 표준입니다. 비디오 압축 코딩은 주로 무손실 압축과 손실 압축의 두 가지 범주로 나뉩니다. 무손실 압축은 재구성을 위해 압축 된 데이터를 사용하는 것을 의미하며, 재구성 된 데이터는 디스크 파일 압축과 같은 원본 데이터와 정확히 동일합니다. 손실 압축은 비가 역적 코딩이라고도합니다. 즉, 압축 된 데이터를 복원에 사용하면 복원 된 데이터가 원본 데이터와 다르지만 원본 데이터가 표현한 정보에 대한 사람들의 오해에는 영향을 미치지 않습니다.

     

    현재 컴퓨터 비전 기술은 빠르게 발전하고 있으며 예비 산업 규모를 가지고 있습니다. 컴퓨터 비전 기술의 향후 개발은 주로 다음과 같은 과제에 직면 할 것입니다. 첫째, 다른 응용 분야의 다른 기술과 더 잘 통합되는 방법 컴퓨터 비전은 특정 문제를 해결할 때 빅 데이터를 광범위하게 사용할 수 있습니다. 점차 성숙되어 인간을 능가 할 수 있습니다. 일부 문제에서는 높은 정확도를 달성하는 것이 불가능합니다. 두 번째는 컴퓨터 비전 알고리즘의 개발 시간과 인건비를 줄이는 방법입니다. 현재 컴퓨터 비전 알고리즘에는 많은 양의 데이터와 수동 주석이 필요하며 응용 분야를 달성하려면 긴 개발주기가 필요합니다. 필요한 정밀도와 시간 소모, 세 번째는 새로운 알고리즘의 설계 및 개발 속도를 높이는 방법입니다. 새로운 이미징 하드웨어 및 인공 지능 칩의 출현으로 다양한 칩 및 데이터 수집 장비에 대한 컴퓨터 비전 알고리즘의 설계 및 개발도 과제 중 하나입니다.

     

    댓글

    Designed by JB FACTORY