MMPCBench: Missing Modality Product Completion Benchmark

A comprehensive benchmark for evaluating MLLM-based missing modality product completion using Amazon product data. This project provides tools for downloading, processing, and evaluating multimodal recommendation systems with missing data scenarios.

Project Overview

MMPCBench consists of two main components:

CQBench: For multimodal completion quality evaluation
Recbench: For recommendation system evaluation with missing data

Quick Start

1. Data Download and Processing

First, download and process the Amazon dataset:

cd MMPCBench
python download_amazon_data_rec.py

This script will:

Download Amazon product data for 9 categories
Process and filter the data
Generate multimodal datasets with images and text
Save in MSRBench format for further processing

2. Generate Missing Data Completions

Using CQBench (Completion Quality)

cd MMPCBench/CQBench
python imagine_amazon_data_bench.py --model qwen2.5-vl-7b --gpu_id 0 --mode title

This generates product titles from images or image prompts from descriptions.

Using Recbench (Recommendation Completion)

cd MMPCBench/Recbench
python imagine_amazon_data_rec.py --model qwen2.5-vl-7b --gpu_id 0 --mode title

This generates completions specifically for recommendation scenarios.

3. Run Recommendation Experiments

cd MMPCBench/Recbench/src
python main.py -m FREEDOM -d all_beauty --completion_method qwen_vl_7b --missing_type image

Project Structure

MMPCBench/
├── download_amazon_data_rec.py    # Data download and processing
├── CQBench/                       # Completion quality evaluation
│   ├── imagine_amazon_data_bench.py
│   ├── generate_images_from_prompts.py
│   └── gather_text.py
├── Recbench/                      # Recommendation system evaluation
│   ├── imagine_amazon_data_rec.py
│   ├── run_my_experiments.py
│   ├── src/
│   │   ├── main.py               # Main experiment runner
│   │   ├── models/               # Model implementations
│   │   └── utils/                # Utility functions
│   └── usage_instructions.md     # Usage instructions
└── README.md                      # This file

Supported Models

Vision-Language Models for Completion

Qwen2.5-VL: 7B, 32B, 72B variants
Gemma-3: 4B, 12B, 27B variants
LLaVA: Multiple variants

Recommendation Models

VBPR
BM3
FREEDOM
... (and all available models from MMRec)

Supported Datasets

Amazon product categories:

All Beauty
Toys and Games
Video Games
Home and Kitchen
Electronics
Industrial and Scientific
Office Products
Musical Instruments
Arts, Crafts and Sewing

Usage Examples

Batch Experiment Running

# Run all experiments on all datasets
cd MMPCBench/Recbench
python run_my_experiments.py

Custom Configuration

# Run specific model on specific dataset
cd MMPCBench/Recbench/src
python main.py -m FREEDOM -d electronics --completion_method qwen_vl_7b --missing_type image

Configuration

GPU Settings

Edit run_my_experiments.py to set your GPU ID:

GPU_ID = 0  # Change to your GPU ID

Experiment Parameters

missing_rate: Percentage of missing data (0.0-1.0)
completion_method: Method for completing missing data
missing_type: Type of missing data (image/text)

Dependencies

Core Requirements

pip install torch torchvision
pip install transformers accelerate
pip install pandas numpy tqdm
pip install psutil GPUtil

Vision-Language Models

# For Qwen models
pip install qwen-vl-utils[decord]

# For Gemma models
pip install transformers[torch]

# For InternVL3
pip install lmdeploy

# For LLaVA
pip install transformers[torch]

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MMPCBench: Missing Modality Product Completion Benchmark

Project Overview

Quick Start

1. Data Download and Processing

2. Generate Missing Data Completions

Using CQBench (Completion Quality)

Using Recbench (Recommendation Completion)

3. Run Recommendation Experiments

Project Structure

Supported Models

Vision-Language Models for Completion

Recommendation Models

Supported Datasets

Usage Examples

Batch Experiment Running

Custom Configuration

Configuration

GPU Settings

Experiment Parameters

Dependencies

Core Requirements

Vision-Language Models

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
CQBench		CQBench
Recbench		Recbench
README.md		README.md
download_amazon_data_rec.py		download_amazon_data_rec.py

Folders and files

Latest commit

History

Repository files navigation

MMPCBench: Missing Modality Product Completion Benchmark

Project Overview

Quick Start

1. Data Download and Processing

2. Generate Missing Data Completions

Using CQBench (Completion Quality)

Using Recbench (Recommendation Completion)

3. Run Recommendation Experiments

Project Structure

Supported Models

Vision-Language Models for Completion

Recommendation Models

Supported Datasets

Usage Examples

Batch Experiment Running

Custom Configuration

Configuration

GPU Settings

Experiment Parameters

Dependencies

Core Requirements

Vision-Language Models

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages