Andrei is available for hire

安德烈很有

验证专家 in 工程

人工智能开发人员

Location

Iaș我,罗马尼亚

至今成员总数

2022年9月1日

安德烈在他的家乡罗马尼亚学习计算机科学，并在阿姆斯特丹大学完成了他的人工智能硕士学位. 经过多年的训练，他积累了人工智能方面的实践Experience, 开发数据处理管道, 和部署. 他是一名工程师，总是期待新的挑战. Andrei也有学术Experience，发表了两篇关于神经修剪和量化的论文, 哪些受到了学术界的好评.

机器学习人工智能(AI)深度学习计算机视觉数据可视化自然语言处理(NLP)ChatGPT GitHub Python 3 PyTorch Python OpenCV 算法数据分析软件工程

Portfolio

Omnimodular

自然语言处理(NLP)，生成预训练变形器(GPT)...

Braincreators

Python 3, 英伟达卫, FastAPI, Streamlit，计算机视觉，对象检测...

Mantis NLP

聊天语言，BERT，自然语言处理(NLP)，机器学习...

Experience

机器学习- 4年计算机视觉- 3年 PyTorch - 3年 Python 3 - 3年生成预训练变形金刚(GPT) - 2年 GPT - 2年自然语言处理(NLP) - 2年神经网络修剪- 2年

Availability

Full-time

首选的环境

Linux, Visual Studio Code (VS Code)， Slack, Rocket.聊天，谷歌云/套件

最神奇的...

...我在benelearning 2020上发表的硕士论文获得了最佳论文奖，这篇论文是关于我开发的一种新颖的修剪算法.

工作Experience

机器学习工程师

2021年至今

Omnimodular

为多类文档分类构建了一个定制的、灵活的类似bert的体系结构，并对来自不同客户端的数据进行了训练, 获得90-94%的平均准确率.
将传统的NLP增强模型与GPT-3大语言模型相结合，为客户进行数据增强, 将错误率降低50%.
使用基于Apache Arrow的hug Face数据集来处理通常不适合内存的大量数据，并通过批处理和多处理实现了高效且可复制的数据处理管道.
定期召开客户会议, 给出我们技术解决方案的高层次概述，并解释我们的核心指标.

Technologies: 自然语言处理(NLP)，生成预训练变形器(GPT), GPT, 拥抱的脸, 变形金刚, BERT, DVC, Docker, 码头工人组成, FastAPI, 机器学习操作(MLOps), 语言模型, Python, 软件工程, 机器学习, 人工智能(AI), 大型语言模型(llm), 概念验证(POC), 最小可行产品(MVP), 自然语言理解(NLU), Pandas, Matplotlib, Contract, GitHub, 信息提取, 开放神经网络交换(ONNX), 生成式人工智能(GenAI), PDF, ChatGPT, OpenAI GPT-3 API, OpenAI API, 数据可视化

机器学习工程师

2020年至今

Braincreators

训练YOLOv5目标检测网络，用于废物管理和回收, 在传统GPU上，以每秒200帧以上的速度，在40多个类别的对象上获得了超过95%的平均精度分数.
围绕对象检测网络构建一个应用程序，使用FastAPI公开端点，并为UI使用Streamlit, 训练后将网络转换为ONNX格式，以加快推理时间.
使用CLIP预训练模型创建了一个用于分布外检测的模块, 在分布内/分布外分类中获得超过97%的准确率，同时允许在不重新训练的情况下更改类分类法.
与项目干系人定期举行会议, 为客户提供演示和演示，为下一个里程碑提供估计, 并进行冲刺计划会议, 跟踪进度.
在《欧博体育app下载》特刊发表论文《欧博体育app下载》, 证明修剪和量化可以在不牺牲精度的情况下带来更大的加速.
使用带有重新识别的SORT算法实现对象跟踪，跟踪对象随时间的轨迹. 获得85%以上的MOTA(多目标跟踪精度)和80%以上的IDF1.

技术:Python 3, 英伟达卫, FastAPI, Streamlit，计算机视觉，对象检测, PyTorch, Docker, 码头工人组成, 深度学习, 你只看一次(YOLO), 神经网络修剪, 量化, 检测工程, 开放神经网络交换(ONNX), Agile, Bash, Python, 软件工程, 机器学习, 人工智能(AI), 概念验证(POC), 最小可行产品(MVP), Pandas, Matplotlib, Contract, PyTorch闪电, GitHub, OpenCV, TensorRT, 图像处理, 拥抱的脸, 生成式人工智能(GenAI), 数据可视化

机器学习工程师

2023 - 2023

Mantis NLP

设计了一种基于bert的医学研究文献标注体系结构. 实施有效和可扩展的培训管道, 能够在几个小时内处理1500多万份文件. 达到了最先进的微f1分数的70%.
创建了一个易于创建的面向用户的应用程序, deployment, 以及使用AWS Sagemaker在生产环境中删除机器学习模型. 包括监视、警报和完整的测试套件，以确保质量和可靠性.
使用Langchain与ChatGPT和FAISS. 创建了一个个人助理，可以根据用户收集的笔记回答用户的问题. 执行快速工程以获得更高质量的响应.
与主要客户和利益相关者保持密切联系，以确保我们的需求一致，并在项目的各个阶段创造最高质量的可交付成果.

Technologies: 聊天语言，BERT，自然语言处理(NLP)，机器学习, OpenAI GPT-3 API, OpenAI GPT-4 API, LangChain, Chatbots, AWS IoT, 亚马逊SageMaker, FAISS, 生成预训练变压器(GPT), 生成预训练变压器3 (GPT-3), 提示工程, 亚马逊网络服务(AWS), OpenAI API, 数据可视化

机器学习研究实习

2019 - 2020

BrainCreators

研究并积累了神经网络修剪技术的专业知识，这是我硕士论文的一部分.
开发了一种新的剪枝算法，可以获得高稀疏度场景和其他属性(如训练期间的剪枝能力)的最新结果, 计算温顺, 以及超参数不变性.
因围绕上述算法撰写科学论文并在比利时举行的BeneLearn 2020会议上发表而获得最佳论文奖, 荷兰, 和卢森堡.

技术:PyTorch, TensorBoard, Python 3, 科学计算, Research, 计算机视觉, 深度神经网络, 神经网络修剪, 量化, Docker, 码头工人组成, Python, 软件工程, 机器学习, 人工智能(AI), Pandas, Matplotlib, GitHub, OpenCV, 图像处理, 数据可视化, TensorFlow

数据科学家

2019 - 2019

FeedbackFruits

利用SARIMA方法建立了时间序列预测模型, 在置信范围内实现所有预测的低均方误差.
创建了一个编码器/解码器门控循环单元网络用于文档部分分类, 获得超过90%的准确度.
通过RESTful api公开核心功能，将训练好的模型部署到生产环境中，并监控生产环境中的性能.

技术:瓶, 长短期记忆(LSTM), 时间序列, ARIMA模型, REST, APIs, 数据科学, Python, 软件工程, 机器学习, 人工智能(AI), 自然语言理解(NLU), Pandas, Matplotlib, GitHub, 信息提取

研究科学家实习生

2017 - 2017

Amazon.com

分析客户在平台上的行为，并开发了一个具有较高ROC-AUC得分的随机森林模型.
使用Apache火花处理大量数据，并使用Python和Scala api以及Spark SQL创建数据处理管道来过滤和准备数据.
进行A/B测试，并将结果模型集成到几个Amazon站点中.

技术:Python 3, Apache火花, Zeppelin, 随机森林, 机器学习, Spark SQL, Scikit-learn, Python, 软件工程, 人工智能(AI), GitHub, 亚马逊网络服务(AWS)

Experience

FlipOut |通过符号翻转发现冗余权重

http://github.com/AndreiXYZ/flipout

一种神经网络剪枝方法, 哪一种方法在准确性和稀疏性的权衡方面获得了最先进的结果. 它的工作原理是在训练过程中监控权重，并去除在0值附近振荡的权重, 假设振荡代表了这些权值的局部最优.

它可以去除普通网络中98%以上的连接，而对准确性几乎没有影响, 允许大的速度增益. 与文献中的基线相比, 这种方法可以在训练时进行修剪, 对超参数的选择不敏感, 并且允许直接选择稀疏度级别.

我围绕这种方法写了一篇论文，并发表在BeneLearn 2020上, 获得最佳论文奖.

Skills

Languages

Python 3, Python, Bash, SQL

框架

Flask, Apache火花

库/ api

PyTorch, Matplotlib, OpenCV, Scikit-learn, Pandas, PyTorch闪电, TensorFlow, NumPy

Tools

TensorBoard, 你只看一次(YOLO), Slack, GitHub, Git, 码头工人组成, Spark SQL, 亚马逊SageMaker

Platforms

Visual Studio Code (VS Code)， Rocket.聊天、Linux、Docker、齐柏林飞艇、AWS IoT、亚马逊网络服务(AWS)

Other

机器学习, 深度学习, 自然语言处理(NLP), 计算机视觉, 长短期记忆(LSTM), 深度神经网络, 神经网络修剪, 量化, FastAPI, 对象检测, 变形金刚, BERT, 分类, English, 谷歌云/套件, 人工智能(AI), 概念验证(POC), 最小可行产品(MVP), 自然语言理解(NLU), Contract, 信息提取, GPT, 生成预训练变压器(GPT), ChatGPT, OpenAI GPT-3 API, 数据可视化, 统计数据, 软件工程, 科学数据分析, 随机森林, APIs, 科学计算, Research, 英伟达卫, Streamlit, 检测工程, 开放神经网络交换(ONNX), 拥抱的脸, DVC, 机器学习操作(MLOps), 语言模型, 算法, 数据分析, 大型语言模型(llm), TensorRT, 图像处理, 生成对抗网络(GANs), 生成式人工智能(GenAI), OCR, PDF, Chatbots, OpenAI API, 信息检索, 集群计算, 时间序列, ARIMA模型, DeepSpeed, 3D, OpenAI GPT-4 API, LangChain, FAISS, 生成预训练变压器3 (GPT-3), 提示工程

Paradigms

面向对象编程(OOP)，数据科学，敏捷，REST

Education

2018 - 2020

人工智能硕士学位

阿姆斯特丹大学-阿姆斯特丹，荷兰

2015 - 2018

计算机科学学士学位

亚历山德鲁伊安库萨大学- Iași，罗马尼亚

认证

2023年1月至今

模型并行:构建和部署大型神经网络

NVIDIA

2018年5月至今

雅思学术证书(母语水平)

英国文化协会