【飞桨论文复现赛-小样本学习】FSL-Baseline
时间:2025-07-28 | 作者: | 阅读:0该复现项目针对《A Closer Look at Few-shot Classification》论文,基于paddlepaddle-gpu2.2.2和python3.7,在miniImageNet数据集上完成。复现的5-way 1-shot和5-shot准确率略超论文。介绍了论文的小样本分类研究、基准模型等,还说明了数据集、运行步骤及代码结构。
一、前言
本项目为百度论文复现赛《A Closer Look at Few-shot Classification》论文复现代码。
依赖环境:
- paddlepaddle-gpu2.2.2
- python3.7
在miniImageNet数据集下训练和测试。
5-way Acc:
二、模型背景及其介绍
参考论文:《A Closer Look at Few-shot Classification》论文链接
小样本分类旨在通过有限标记样例学习一个分类器来识别未知类,虽然近些年取得了一些重要的研究进展,但各方法网络结构、元学习算法的复杂性以及实现细节的差异为比较当前进展提出挑战。论文作者提出:
对几种代表性的小样本分类算法进行一致性比较分析,结果证明随着特征提取神经网络模型能力的提升,在给定领域差异的数据集上,各方法的性能差异显著缩小;
提出了一个基准模型,该模型在mini-ImageNet数据集和CUB数据集上的性能可以媲美几种SOTA方法;
提出了一种新的用于评估小样本分类算法跨领域泛化能力的实验设定,结果发现当特征提取神经网络能力较弱时,减少类内差异是提升模型性能的一个重要因素,当特征提取神经网络能力较强时,类内差异不再关键。
论文中提出的baseline模型遵循标准迁移学习的网络预训练以及微调。
训练阶段将图像输入到特征提取器中,再经过分类器进行分类。
微调阶段将训练好的模型参数固定在特征提取器中,然后重新训练一个分类器。
除Baseline模型外,论文还引入了Baseline模型的变体,Baseline++。Baseline++不同于前者的是在分类阶段采用了一个输入特征f(x)与权值矩阵的余弦相似度,然后根据这个相似度来进行softmax分类。 作者提出的Baseline和Baseline++模型如下图所示:
参考项目地址
复现github地址
三、数据集
2016年google DeepMind团队从Imagnet数据集中抽取的一小部分(大小约3GB)制作了Mini-Imagenet数据集,共有100个类别,每个类别都有600张图片,共60000张(都是.jpg结尾的文件)。
Mini-Imagenet数据集中还包含了train.csv、val.csv以及test.csv三个文件。
- train.csv包含38400张图片,共64个类别。
- val.csv包含9600张图片,共16个类别。
- test.csv包含12000张图片,共20个类别。
每个csv文件之间的图像以及类别都是相互独立的,即共60000张图片,100个类。
四、运行
本项目5-way分类可设1-shot和5-shot。如果用5-shot可设置--n_shot 5,用1-shot可设置--n_shot 1。下面以5-shot为例。
解压miniImagenet数据集到./filelists目录下用于训练
In [1]#加载miniImagenet数据集%cd /home/aistudio/work/Paddle-CLFS/filelists/!unzip -oq /home/aistudio/data/data138415/miniImagenet.zip登录后复制 ? ? ? ?
/home/aistudio/work/Paddle-CLFS/filelists登录后复制 ? ? ? ?
1、训练
训练的模型保存在./record目录下
训练的日志保存在./logs目录下
In [?]%cd /home/aistudio/work/Paddle-CLFS/!python3 train.py --n_shot 5登录后复制 ? ?
2、保存特征
将提取的特征保存在分类层之前,以提高测试速度。
加载./record目录下的模型进行特征保存
In [?]# 可加载预先训练好的模型文件到./record目录下%cd /home/aistudio/work/Paddle-CLFS/record/!unzip -oq /home/aistudio/data/data140016/checkpoint_clfs.zip登录后复制 ? ?In [?]
%cd /home/aistudio/work/Paddle-CLFS/!python3 save_features.py --n_shot 5登录后复制 ? ?
3、测试
测试之前执行!python3 save_features.py预先提取特征
这里展示5-shot测试结果
In [?]%cd /home/aistudio/work/Paddle-CLFS/!python3 test.py --n_shot 5登录后复制 ? ?
五、代码结构
├─data # 数据处理包├─filelists # 数据文件├─methods # 模型方法├─logs # 训练日志├─record # 训练保存文件 │ backbone.py # 特征提取│ configs.py # 配置文件│ io_utils.py # 配置文件│ README.md # readme│ save_features.py # 保存特征│ train.py # 训练│ test.py # 测试登录后复制 ? ?
福利游戏
相关文章
更多-
- 小米世界500强排名狂飙100位!雷军:向“全球新一代硬核科技引领者” 挺进
- 时间:2025-07-29
-
- 吧友热议索尼起诉腾讯:两大巨头强强对决!
- 时间:2025-07-29
-
- nef 格式图片降噪处理用什么工具 效果如何
- 时间:2025-07-29
-
- 美国汽车业界对日本车关税15%表示不满:日本人都不买我们的车
- 时间:2025-07-29
-
- 邮箱长时间未登录被注销了能恢复吗?
- 时间:2025-07-29
-
- 第6次霸气包馆!高通ChinaJoy节目单公布:11大品牌捧场
- 时间:2025-07-29
-
- Outlook收件箱邮件不同步怎么办?
- 时间:2025-07-29
-
- 撞头“卡卡西”的本田核心工程师发中文感谢:原来还是健身大佬
- 时间:2025-07-29
大家都在玩
热门话题
大家都在看
更多-
- 全链网:俄美领导人阿拉斯加峰会可能会提出乌克兰停火计划
- 时间:2025-08-10
-
- 某鲸鱼在休眠一个月后从币安提取274.22枚BTC,价值约3200万美元
- 时间:2025-08-10
-
- Solana – 这一水平如何帮助 SOL 价格上涨 40%
- 时间:2025-08-10
-
- Galaxy Digital两小时内向交易平台转入22.4万枚SOL,价值4112万美元
- 时间:2025-08-10
-
- 随着山寨币投机行为加剧,比特币的主导地位跌至 60% 以下
- 时间:2025-08-10
-
- Abraxas Capital两账户做空ETH等多币种,浮亏超1.9亿美元
- 时间:2025-08-10
-
- 萨尔瓦多过去7日共增持8枚比特币,总持仓为6,263.18枚
- 时间:2025-08-10
-
- 某鲸鱼过去2个月从币安提取超1万枚ETH用于质押,目前约获利1353万美元
- 时间:2025-08-10