安德烈很有
验证专家 in 工程
人工智能开发人员
安德烈在他的家乡罗马尼亚学习计算机科学,并在阿姆斯特丹大学完成了他的人工智能硕士学位. 经过多年的训练,他积累了人工智能方面的实践Experience, 开发数据处理管道, 和部署. 他是一名工程师,总是期待新的挑战. Andrei也有学术Experience,发表了两篇关于神经修剪和量化的论文, 哪些受到了学术界的好评.
Portfolio
Experience
Availability
首选的环境
Linux, Visual Studio Code (VS Code), Slack, Rocket.聊天,谷歌云/套件
最神奇的...
...我在benelearning 2020上发表的硕士论文获得了最佳论文奖,这篇论文是关于我开发的一种新颖的修剪算法.
工作Experience
机器学习工程师
Omnimodular
- 为多类文档分类构建了一个定制的、灵活的类似bert的体系结构,并对来自不同客户端的数据进行了训练, 获得90-94%的平均准确率.
- 将传统的NLP增强模型与GPT-3大语言模型相结合,为客户进行数据增强, 将错误率降低50%.
- 使用基于Apache Arrow的hug Face数据集来处理通常不适合内存的大量数据,并通过批处理和多处理实现了高效且可复制的数据处理管道.
- 定期召开客户会议, 给出我们技术解决方案的高层次概述,并解释我们的核心指标.
机器学习工程师
Braincreators
- 训练YOLOv5目标检测网络,用于废物管理和回收, 在传统GPU上,以每秒200帧以上的速度,在40多个类别的对象上获得了超过95%的平均精度分数.
- 围绕对象检测网络构建一个应用程序,使用FastAPI公开端点,并为UI使用Streamlit, 训练后将网络转换为ONNX格式,以加快推理时间.
- 使用CLIP预训练模型创建了一个用于分布外检测的模块, 在分布内/分布外分类中获得超过97%的准确率,同时允许在不重新训练的情况下更改类分类法.
- 与项目干系人定期举行会议, 为客户提供演示和演示,为下一个里程碑提供估计, 并进行冲刺计划会议, 跟踪进度.
- 在《欧博体育app下载》特刊发表论文《欧博体育app下载》, 证明修剪和量化可以在不牺牲精度的情况下带来更大的加速.
- 使用带有重新识别的SORT算法实现对象跟踪,跟踪对象随时间的轨迹. 获得85%以上的MOTA(多目标跟踪精度)和80%以上的IDF1.
机器学习工程师
Mantis NLP
- 设计了一种基于bert的医学研究文献标注体系结构. 实施有效和可扩展的培训管道, 能够在几个小时内处理1500多万份文件. 达到了最先进的微f1分数的70%.
- 创建了一个易于创建的面向用户的应用程序, deployment, 以及使用AWS Sagemaker在生产环境中删除机器学习模型. 包括监视、警报和完整的测试套件,以确保质量和可靠性.
- 使用Langchain与ChatGPT和FAISS. 创建了一个个人助理,可以根据用户收集的笔记回答用户的问题. 执行快速工程以获得更高质量的响应.
- 与主要客户和利益相关者保持密切联系,以确保我们的需求一致,并在项目的各个阶段创造最高质量的可交付成果.
机器学习研究实习
BrainCreators
- 研究并积累了神经网络修剪技术的专业知识,这是我硕士论文的一部分.
- 开发了一种新的剪枝算法,可以获得高稀疏度场景和其他属性(如训练期间的剪枝能力)的最新结果, 计算温顺, 以及超参数不变性.
- 因围绕上述算法撰写科学论文并在比利时举行的BeneLearn 2020会议上发表而获得最佳论文奖, 荷兰, 和卢森堡.
数据科学家
FeedbackFruits
- 利用SARIMA方法建立了时间序列预测模型, 在置信范围内实现所有预测的低均方误差.
- 创建了一个编码器/解码器门控循环单元网络用于文档部分分类, 获得超过90%的准确度.
- 通过RESTful api公开核心功能,将训练好的模型部署到生产环境中,并监控生产环境中的性能.
研究科学家实习生
Amazon.com
- 分析客户在平台上的行为,并开发了一个具有较高ROC-AUC得分的随机森林模型.
- 使用Apache火花处理大量数据,并使用Python和Scala api以及Spark SQL创建数据处理管道来过滤和准备数据.
- 进行A/B测试,并将结果模型集成到几个Amazon站点中.
Experience
FlipOut |通过符号翻转发现冗余权重
http://github.com/AndreiXYZ/flipout它可以去除普通网络中98%以上的连接,而对准确性几乎没有影响, 允许大的速度增益. 与文献中的基线相比, 这种方法可以在训练时进行修剪, 对超参数的选择不敏感, 并且允许直接选择稀疏度级别.
我围绕这种方法写了一篇论文,并发表在BeneLearn 2020上, 获得最佳论文奖.
Skills
Languages
Python 3, Python, Bash, SQL
框架
Flask, Apache火花
库/ api
PyTorch, Matplotlib, OpenCV, Scikit-learn, Pandas, PyTorch闪电, TensorFlow, NumPy
Tools
TensorBoard, 你只看一次(YOLO), Slack, GitHub, Git, 码头工人组成, Spark SQL, 亚马逊SageMaker
Platforms
Visual Studio Code (VS Code), Rocket.聊天、Linux、Docker、齐柏林飞艇、AWS IoT、亚马逊网络服务(AWS)
Other
机器学习, 深度学习, 自然语言处理(NLP), 计算机视觉, 长短期记忆(LSTM), 深度神经网络, 神经网络修剪, 量化, FastAPI, 对象检测, 变形金刚, BERT, 分类, English, 谷歌云/套件, 人工智能(AI), 概念验证(POC), 最小可行产品(MVP), 自然语言理解(NLU), Contract, 信息提取, GPT, 生成预训练变压器(GPT), ChatGPT, OpenAI GPT-3 API, 数据可视化, 统计数据, 软件工程, 科学数据分析, 随机森林, APIs, 科学计算, Research, 英伟达卫, Streamlit, 检测工程, 开放神经网络交换(ONNX), 拥抱的脸, DVC, 机器学习操作(MLOps), 语言模型, 算法, 数据分析, 大型语言模型(llm), TensorRT, 图像处理, 生成对抗网络(GANs), 生成式人工智能(GenAI), OCR, PDF, Chatbots, OpenAI API, 信息检索, 集群计算, 时间序列, ARIMA模型, DeepSpeed, 3D, OpenAI GPT-4 API, LangChain, FAISS, 生成预训练变压器3 (GPT-3), 提示工程
Paradigms
面向对象编程(OOP),数据科学,敏捷,REST
Education
人工智能硕士学位
阿姆斯特丹大学-阿姆斯特丹,荷兰
计算机科学学士学位
亚历山德鲁伊安库萨大学- Iași,罗马尼亚
认证
模型并行:构建和部署大型神经网络
NVIDIA
雅思学术证书(母语水平)
英国文化协会