revise benchmark

CraftJarvis · Dec 11, 2024 · 3076947 · 3076947
1 parent ef29e1a
commit 3076947
Show file tree

Hide file tree

Showing 175 changed files with 122 additions and 24 deletions.
diff --git a/minestudio/benchmark/auto_eval/README.md b/minestudio/benchmark/auto_eval/README.md
@@ -9,9 +9,9 @@ python rule_generation.py
 ## Evaluating videos with VLM
 ```bash
 #Compare two videos
-python video_comparison.py --video_path_a='./eval_video/build_pillar/build_pillar_0.mp4' --video_path_b='./eval_video/build_pillar/build_pillar_6.mp4' --criteria_path='./auto_eval/criteria_files/build_pillar.txt' 
+python video_comparison.py --video_path_a='./eval_video/build_gate/build_gate_5.mp4' --video_path_b='./eval_video/build_gate/build_gate_7.mp4' --criteria_path='./auto_eval/criteria_files/build_gate.txt' 
 #Individual video evaluation
-python individual_video_rating.py --video_path='./eval_video/build_pillar/build_pillar_0.mp4' --criteria_path='./auto_eval/criteria_files/build_pillar.txt' 
+python individual_video_rating.py --video_path='./eval_video/build_gate/build_gate_5.mp4' --criteria_path='./auto_eval/criteria_files/build_gate.txt' 
 #Batch video evaluation
 python batch_video_rating.py --videos_path='./eval_video/' --criteria_files_path='./auto_eval/criteria_files/' 
 ```

diff --git a/minestudio/benchmark/auto_eval/batch_video_rating.py b/minestudio/benchmark/auto_eval/batch_video_rating.py
@@ -1,3 +1,9 @@
+'''
+Date: 2024-11-21 21:38:32
+LastEditors: zhengxinyue
+LastEditTime: 2024-12-06 16:38:33
+FilePath: /MineStudio/minestudio/benchmark/auto_eval/batch_video_rating.py
+'''
 import cv2  # We're using OpenCV to read video
 import base64
 import time

diff --git a/minestudio/benchmark/auto_eval/individual_video_rating.py b/minestudio/benchmark/auto_eval/individual_video_rating.py
@@ -1,3 +1,9 @@
+'''
+Date: 2024-11-21 21:38:32
+LastEditors: zhengxinyue
+LastEditTime: 2024-12-06 16:38:55
+FilePath: /MineStudio/minestudio/benchmark/auto_eval/individual_video_rating.py
+'''
 import cv2  # We're using OpenCV to read video
 import base64
 import time

diff --git a/minestudio/benchmark/auto_eval/rule_generation.py b/minestudio/benchmark/auto_eval/rule_generation.py
@@ -1,3 +1,9 @@
+'''
+Date: 2024-11-21 21:38:32
+LastEditors: zhengxinyue
+LastEditTime: 2024-12-06 16:39:05
+FilePath: /MineStudio/minestudio/benchmark/auto_eval/rule_generation.py
+'''
 import os
 import argparse
 import numpy as np

diff --git a/minestudio/benchmark/auto_eval/task_configs/simple/build_dig3fill1.yaml b/minestudio/benchmark/auto_eval/task_configs/simple/build_dig3fill1.yaml
diff --git a/minestudio/benchmark/auto_eval/video_comparison.py b/minestudio/benchmark/auto_eval/video_comparison.py
@@ -1,3 +1,9 @@
+'''
+Date: 2024-11-21 21:38:32
+LastEditors: zhengxinyue
+LastEditTime: 2024-12-06 16:39:13
+FilePath: /MineStudio/minestudio/benchmark/auto_eval/video_comparison.py
+'''
 import cv2  # We're using OpenCV to read video
 import base64
 import time

diff --git a/minestudio/benchmark/read_conf.py b/minestudio/benchmark/read_conf.py
@@ -0,0 +1,22 @@
+'''
+Date: 2024-12-06 16:42:49
+LastEditors: zhengxinyue
+LastEditTime: 2024-12-11 17:44:10
+FilePath: /MineStudio/minestudio/benchmark/read_conf.py
+'''
+import os
+import yaml
+
+def convert_yaml_to_callbacks(yaml_file):
+    with open(yaml_file, 'r') as f:
+        data = yaml.safe_load(f)
+    commands = data.get('custom_init_commands', [])
+    commands_callback = f"{commands}"
+
+    text = data.get('text', '')
+    task_name = os.path.splitext(os.path.basename(yaml_file))[0]
+    task_callback = (
+        f"{{'name': '{task_name}', 'text': '{text}'}}"
+    )
+
+    return commands_callback, task_callback
diff --git a/...ark/auto_eval/task_configs/hard/base.yaml → ...dio/benchmark/task_configs/hard/base.yaml b/...ark/auto_eval/task_configs/hard/base.yaml → ...dio/benchmark/task_configs/hard/base.yaml
diff --git a/.../task_configs/hard/build_a_waterfall.yaml → .../task_configs/hard/build_a_waterfall.yaml b/.../task_configs/hard/build_a_waterfall.yaml → .../task_configs/hard/build_a_waterfall.yaml
diff --git a/...al/task_configs/hard/build_dig3fill1.yaml → ...rk/task_configs/hard/build_dig3fill1.yaml b/...al/task_configs/hard/build_dig3fill1.yaml → ...rk/task_configs/hard/build_dig3fill1.yaml
diff --git a/...to_eval/task_configs/hard/build_gate.yaml → ...nchmark/task_configs/hard/build_gate.yaml b/...to_eval/task_configs/hard/build_gate.yaml → ...nchmark/task_configs/hard/build_gate.yaml
diff --git a/..._eval/task_configs/hard/build_golems.yaml → ...hmark/task_configs/hard/build_golems.yaml b/..._eval/task_configs/hard/build_golems.yaml → ...hmark/task_configs/hard/build_golems.yaml
diff --git a/...ask_configs/hard/build_nether_portal.yaml → ...ask_configs/hard/build_nether_portal.yaml b/...ask_configs/hard/build_nether_portal.yaml → ...ask_configs/hard/build_nether_portal.yaml
diff --git a/...val/task_configs/hard/build_obsidian.yaml → ...ark/task_configs/hard/build_obsidian.yaml b/...val/task_configs/hard/build_obsidian.yaml → ...ark/task_configs/hard/build_obsidian.yaml
diff --git a/..._eval/task_configs/hard/build_pillar.yaml → ...hmark/task_configs/hard/build_pillar.yaml b/..._eval/task_configs/hard/build_pillar.yaml → ...hmark/task_configs/hard/build_pillar.yaml
diff --git a/...l/task_configs/hard/build_snow_golem.yaml → ...k/task_configs/hard/build_snow_golem.yaml b/...l/task_configs/hard/build_snow_golem.yaml → ...k/task_configs/hard/build_snow_golem.yaml
diff --git a/.../task_configs/hard/build_snow_golems.yaml → .../task_configs/hard/build_snow_golems.yaml b/.../task_configs/hard/build_snow_golems.yaml → .../task_configs/hard/build_snow_golems.yaml
diff --git a/...al/task_configs/hard/build_waterfall.yaml → ...rk/task_configs/hard/build_waterfall.yaml b/...al/task_configs/hard/build_waterfall.yaml → ...rk/task_configs/hard/build_waterfall.yaml
diff --git a/...eval/task_configs/hard/carve_pumpkin.yaml → ...mark/task_configs/hard/carve_pumpkin.yaml b/...eval/task_configs/hard/carve_pumpkin.yaml → ...mark/task_configs/hard/carve_pumpkin.yaml
diff --git a/...val/task_configs/hard/carve_pumpkins.yaml → ...ark/task_configs/hard/carve_pumpkins.yaml b/...val/task_configs/hard/carve_pumpkins.yaml → ...ark/task_configs/hard/carve_pumpkins.yaml
diff --git a/...auto_eval/task_configs/hard/clean_up.yaml → ...benchmark/task_configs/hard/clean_up.yaml b/...auto_eval/task_configs/hard/clean_up.yaml → ...benchmark/task_configs/hard/clean_up.yaml
diff --git a/...task_configs/hard/climb_the_mountain.yaml → ...task_configs/hard/climb_the_mountain.yaml b/...task_configs/hard/climb_the_mountain.yaml → ...task_configs/hard/climb_the_mountain.yaml
diff --git a/..._eval/task_configs/hard/collect_dirt.yaml → ...hmark/task_configs/hard/collect_dirt.yaml b/..._eval/task_configs/hard/collect_dirt.yaml → ...hmark/task_configs/hard/collect_dirt.yaml
diff --git a/...eval/task_configs/hard/collect_grass.yaml → ...mark/task_configs/hard/collect_grass.yaml b/...eval/task_configs/hard/collect_grass.yaml → ...mark/task_configs/hard/collect_grass.yaml
diff --git a/...l/task_configs/hard/collect_seagrass.yaml → ...k/task_configs/hard/collect_seagrass.yaml b/...l/task_configs/hard/collect_seagrass.yaml → ...k/task_configs/hard/collect_seagrass.yaml
diff --git a/..._eval/task_configs/hard/collect_wood.yaml → ...hmark/task_configs/hard/collect_wood.yaml b/..._eval/task_configs/hard/collect_wood.yaml → ...hmark/task_configs/hard/collect_wood.yaml
diff --git a/..._eval/task_configs/hard/collect_wool.yaml → ...hmark/task_configs/hard/collect_wool.yaml b/..._eval/task_configs/hard/collect_wool.yaml → ...hmark/task_configs/hard/collect_wool.yaml
diff --git a/...al/task_configs/hard/combat_enderman.yaml → ...rk/task_configs/hard/combat_enderman.yaml b/...al/task_configs/hard/combat_enderman.yaml → ...rk/task_configs/hard/combat_enderman.yaml
diff --git a/...val/task_configs/hard/combat_enemies.yaml → ...ark/task_configs/hard/combat_enemies.yaml b/...val/task_configs/hard/combat_enemies.yaml → ...ark/task_configs/hard/combat_enemies.yaml
diff --git a/...l/task_configs/hard/combat_skeletons.yaml → ...k/task_configs/hard/combat_skeletons.yaml b/...l/task_configs/hard/combat_skeletons.yaml → ...k/task_configs/hard/combat_skeletons.yaml
diff --git a/...eval/task_configs/hard/combat_spider.yaml → ...mark/task_configs/hard/combat_spider.yaml b/...eval/task_configs/hard/combat_spider.yaml → ...mark/task_configs/hard/combat_spider.yaml
diff --git a/...val/task_configs/hard/combat_spiders.yaml → ...ark/task_configs/hard/combat_spiders.yaml b/...val/task_configs/hard/combat_spiders.yaml → ...ark/task_configs/hard/combat_spiders.yaml
diff --git a/...val/task_configs/hard/combat_zombies.yaml → ...ark/task_configs/hard/combat_zombies.yaml b/...val/task_configs/hard/combat_zombies.yaml → ...ark/task_configs/hard/combat_zombies.yaml
diff --git a/.../task_configs/hard/craft_enchantment.yaml → .../task_configs/hard/craft_enchantment.yaml b/.../task_configs/hard/craft_enchantment.yaml → .../task_configs/hard/craft_enchantment.yaml
diff --git a/..._eval/task_configs/hard/craft_ladder.yaml → ...hmark/task_configs/hard/craft_ladder.yaml b/..._eval/task_configs/hard/craft_ladder.yaml → ...hmark/task_configs/hard/craft_ladder.yaml
diff --git a/...eval/task_configs/hard/craft_ladders.yaml → ...mark/task_configs/hard/craft_ladders.yaml b/...eval/task_configs/hard/craft_ladders.yaml → ...mark/task_configs/hard/craft_ladders.yaml
diff --git a/...val/task_configs/hard/craft_smelting.yaml → ...ark/task_configs/hard/craft_smelting.yaml b/...val/task_configs/hard/craft_smelting.yaml → ...ark/task_configs/hard/craft_smelting.yaml
diff --git a/...val/task_configs/hard/craft_stonecut.yaml → ...ark/task_configs/hard/craft_stonecut.yaml b/...val/task_configs/hard/craft_stonecut.yaml → ...ark/task_configs/hard/craft_stonecut.yaml
diff --git a/...o_eval/task_configs/hard/craft_table.yaml → ...chmark/task_configs/hard/craft_table.yaml b/...o_eval/task_configs/hard/craft_table.yaml → ...chmark/task_configs/hard/craft_table.yaml
diff --git a/...onfigs/hard/craft_the_crafting_table.yaml → ...onfigs/hard/craft_the_crafting_table.yaml b/...onfigs/hard/craft_the_crafting_table.yaml → ...onfigs/hard/craft_the_crafting_table.yaml
diff --git a/...eval/task_configs/hard/craft_to_cake.yaml → ...mark/task_configs/hard/craft_to_cake.yaml b/...eval/task_configs/hard/craft_to_cake.yaml → ...mark/task_configs/hard/craft_to_cake.yaml
diff --git a/...val/task_configs/hard/craft_to_clock.yaml → ...ark/task_configs/hard/craft_to_clock.yaml b/...val/task_configs/hard/craft_to_clock.yaml → ...ark/task_configs/hard/craft_to_clock.yaml
diff --git a/...sk_configs/hard/craft_to_craft_table.yaml → ...sk_configs/hard/craft_to_craft_table.yaml b/...sk_configs/hard/craft_to_craft_table.yaml → ...sk_configs/hard/craft_to_craft_table.yaml
diff --git a/...al/task_configs/hard/craft_to_ladder.yaml → ...rk/task_configs/hard/craft_to_ladder.yaml b/...al/task_configs/hard/craft_to_ladder.yaml → ...rk/task_configs/hard/craft_to_ladder.yaml
diff --git a/...uto_eval/task_configs/hard/cut_stone.yaml → ...enchmark/task_configs/hard/cut_stone.yaml b/...uto_eval/task_configs/hard/cut_stone.yaml → ...enchmark/task_configs/hard/cut_stone.yaml
diff --git a/.../hard/dig_three_down_and_fill_one_up.yaml → .../hard/dig_three_down_and_fill_one_up.yaml b/.../hard/dig_three_down_and_fill_one_up.yaml → .../hard/dig_three_down_and_fill_one_up.yaml
diff --git a/...sk_configs/hard/drink_harming_potion.yaml → ...sk_configs/hard/drink_harming_potion.yaml b/...sk_configs/hard/drink_harming_potion.yaml → ...sk_configs/hard/drink_harming_potion.yaml
diff --git a/...k_configs/hard/enchant_diamond_sword.yaml → ...k_configs/hard/enchant_diamond_sword.yaml b/...k_configs/hard/enchant_diamond_sword.yaml → ...k_configs/hard/enchant_diamond_sword.yaml
diff --git a/...eval/task_configs/hard/enchant_sword.yaml → ...mark/task_configs/hard/enchant_sword.yaml b/...eval/task_configs/hard/enchant_sword.yaml → ...mark/task_configs/hard/enchant_sword.yaml
diff --git a/..._eval/task_configs/hard/explore_boat.yaml → ...hmark/task_configs/hard/explore_boat.yaml b/..._eval/task_configs/hard/explore_boat.yaml → ...hmark/task_configs/hard/explore_boat.yaml
diff --git a/...eval/task_configs/hard/explore_chest.yaml → ...mark/task_configs/hard/explore_chest.yaml b/...eval/task_configs/hard/explore_chest.yaml → ...mark/task_configs/hard/explore_chest.yaml
diff --git a/...eval/task_configs/hard/explore_climb.yaml → ...mark/task_configs/hard/explore_climb.yaml b/...eval/task_configs/hard/explore_climb.yaml → ...mark/task_configs/hard/explore_climb.yaml
diff --git a/..._eval/task_configs/hard/explore_mine.yaml → ...hmark/task_configs/hard/explore_mine.yaml b/..._eval/task_configs/hard/explore_mine.yaml → ...hmark/task_configs/hard/explore_mine.yaml
diff --git a/...o_eval/task_configs/hard/explore_run.yaml → ...chmark/task_configs/hard/explore_run.yaml b/...o_eval/task_configs/hard/explore_run.yaml → ...chmark/task_configs/hard/explore_run.yaml
diff --git a/...sk_configs/hard/explore_the_treasure.yaml → ...sk_configs/hard/explore_the_treasure.yaml b/...sk_configs/hard/explore_the_treasure.yaml → ...sk_configs/hard/explore_the_treasure.yaml
diff --git a/..._eval/task_configs/hard/find_diamond.yaml → ...hmark/task_configs/hard/find_diamond.yaml b/..._eval/task_configs/hard/find_diamond.yaml → ...hmark/task_configs/hard/find_diamond.yaml
diff --git a/...o_eval/task_configs/hard/find_forest.yaml → ...chmark/task_configs/hard/find_forest.yaml b/...o_eval/task_configs/hard/find_forest.yaml → ...chmark/task_configs/hard/find_forest.yaml
diff --git a/..._eval/task_configs/hard/find_village.yaml → ...hmark/task_configs/hard/find_village.yaml b/..._eval/task_configs/hard/find_village.yaml → ...hmark/task_configs/hard/find_village.yaml
diff --git a/..._eval/task_configs/hard/hunt_a_sheep.yaml → ...hmark/task_configs/hard/hunt_a_sheep.yaml b/..._eval/task_configs/hard/hunt_a_sheep.yaml → ...hmark/task_configs/hard/hunt_a_sheep.yaml
diff --git a/..._eval/task_configs/hard/hunt_animals.yaml → ...hmark/task_configs/hard/hunt_animals.yaml b/..._eval/task_configs/hard/hunt_animals.yaml → ...hmark/task_configs/hard/hunt_animals.yaml
diff --git a/..._eval/task_configs/hard/lead_animals.yaml → ...hmark/task_configs/hard/lead_animals.yaml b/..._eval/task_configs/hard/lead_animals.yaml → ...hmark/task_configs/hard/lead_animals.yaml
diff --git a/.../hard/make_fire_with_flint_and_steel.yaml → .../hard/make_fire_with_flint_and_steel.yaml b/.../hard/make_fire_with_flint_and_steel.yaml → .../hard/make_fire_with_flint_and_steel.yaml
diff --git a/...k_configs/hard/make_obsidian_by_wate.yaml → ...k_configs/hard/make_obsidian_by_wate.yaml b/...k_configs/hard/make_obsidian_by_wate.yaml → ...k_configs/hard/make_obsidian_by_wate.yaml
diff --git a/...l/task_configs/hard/mine_diamond_ore.yaml → ...k/task_configs/hard/mine_diamond_ore.yaml b/...l/task_configs/hard/mine_diamond_ore.yaml → ...k/task_configs/hard/mine_diamond_ore.yaml
diff --git a/...uto_eval/task_configs/hard/mine_dirt.yaml → ...enchmark/task_configs/hard/mine_dirt.yaml b/...uto_eval/task_configs/hard/mine_dirt.yaml → ...enchmark/task_configs/hard/mine_dirt.yaml
diff --git a/...to_eval/task_configs/hard/mine_grass.yaml → ...nchmark/task_configs/hard/mine_grass.yaml b/...to_eval/task_configs/hard/mine_grass.yaml → ...nchmark/task_configs/hard/mine_grass.yaml
diff --git a/.../task_configs/hard/mine_horizontally.yaml → .../task_configs/hard/mine_horizontally.yaml b/.../task_configs/hard/mine_horizontally.yaml → .../task_configs/hard/mine_horizontally.yaml
diff --git a/...eval/task_configs/hard/mine_iron_ore.yaml → ...mark/task_configs/hard/mine_iron_ore.yaml b/...eval/task_configs/hard/mine_iron_ore.yaml → ...mark/task_configs/hard/mine_iron_ore.yaml
diff --git a/...eval/task_configs/hard/mine_obsidian.yaml → ...mark/task_configs/hard/mine_obsidian.yaml b/...eval/task_configs/hard/mine_obsidian.yaml → ...mark/task_configs/hard/mine_obsidian.yaml
diff --git a/..._eval/task_configs/hard/plant_wheats.yaml → ...hmark/task_configs/hard/plant_wheats.yaml b/..._eval/task_configs/hard/plant_wheats.yaml → ...hmark/task_configs/hard/plant_wheats.yaml
diff --git a/...a_birthday_present_for_your_neighbor.yaml → ...a_birthday_present_for_your_neighbor.yaml b/...a_birthday_present_for_your_neighbor.yaml → ...a_birthday_present_for_your_neighbor.yaml
diff --git a/...al/task_configs/hard/run_and_explore.yaml → ...rk/task_configs/hard/run_and_explore.yaml b/...al/task_configs/hard/run_and_explore.yaml → ...rk/task_configs/hard/run_and_explore.yaml
diff --git a/...uto_eval/task_configs/hard/set_fires.yaml → ...enchmark/task_configs/hard/set_fires.yaml b/...uto_eval/task_configs/hard/set_fires.yaml → ...enchmark/task_configs/hard/set_fires.yaml
diff --git a/...eval/task_configs/hard/shoot_phantom.yaml → ...mark/task_configs/hard/shoot_phantom.yaml b/...eval/task_configs/hard/shoot_phantom.yaml → ...mark/task_configs/hard/shoot_phantom.yaml
diff --git a/..._eval/task_configs/hard/sleep_in_bed.yaml → ...hmark/task_configs/hard/sleep_in_bed.yaml b/..._eval/task_configs/hard/sleep_in_bed.yaml → ...hmark/task_configs/hard/sleep_in_bed.yaml
diff --git a/...l/task_configs/hard/sleep_on_the_bed.yaml → ...k/task_configs/hard/sleep_on_the_bed.yaml b/...l/task_configs/hard/sleep_on_the_bed.yaml → ...k/task_configs/hard/sleep_on_the_bed.yaml
diff --git a/...to_eval/task_configs/hard/smelt_food.yaml → ...nchmark/task_configs/hard/smelt_food.yaml b/...to_eval/task_configs/hard/smelt_food.yaml → ...nchmark/task_configs/hard/smelt_food.yaml
diff --git a/...val/task_configs/hard/survive_combat.yaml → ...ark/task_configs/hard/survive_combat.yaml b/...val/task_configs/hard/survive_combat.yaml → ...ark/task_configs/hard/survive_combat.yaml
diff --git a/..._eval/task_configs/hard/survive_hunt.yaml → ...hmark/task_configs/hard/survive_hunt.yaml b/..._eval/task_configs/hard/survive_hunt.yaml → ...hmark/task_configs/hard/survive_hunt.yaml
diff --git a/...eval/task_configs/hard/survive_plant.yaml → ...mark/task_configs/hard/survive_plant.yaml b/...eval/task_configs/hard/survive_plant.yaml → ...mark/task_configs/hard/survive_plant.yaml
diff --git a/...val/task_configs/hard/survive_shield.yaml → ...ark/task_configs/hard/survive_shield.yaml b/...val/task_configs/hard/survive_shield.yaml → ...ark/task_configs/hard/survive_shield.yaml
diff --git a/...eval/task_configs/hard/survive_sleep.yaml → ...mark/task_configs/hard/survive_sleep.yaml b/...eval/task_configs/hard/survive_sleep.yaml → ...mark/task_configs/hard/survive_sleep.yaml
diff --git a/...auto_eval/task_configs/hard/tool_bow.yaml → ...benchmark/task_configs/hard/tool_bow.yaml b/...auto_eval/task_configs/hard/tool_bow.yaml → ...benchmark/task_configs/hard/tool_bow.yaml
diff --git a/...to_eval/task_configs/hard/tool_flint.yaml → ...nchmark/task_configs/hard/tool_flint.yaml b/...to_eval/task_configs/hard/tool_flint.yaml → ...nchmark/task_configs/hard/tool_flint.yaml
diff --git a/...uto_eval/task_configs/hard/tool_lead.yaml → ...enchmark/task_configs/hard/tool_lead.yaml b/...uto_eval/task_configs/hard/tool_lead.yaml → ...enchmark/task_configs/hard/tool_lead.yaml
diff --git a/..._eval/task_configs/hard/tool_pumpkin.yaml → ...hmark/task_configs/hard/tool_pumpkin.yaml b/..._eval/task_configs/hard/tool_pumpkin.yaml → ...hmark/task_configs/hard/tool_pumpkin.yaml
diff --git a/..._eval/task_configs/hard/tool_trident.yaml → ...hmark/task_configs/hard/tool_trident.yaml b/..._eval/task_configs/hard/tool_trident.yaml → ...hmark/task_configs/hard/tool_trident.yaml
diff --git a/...val/task_configs/hard/travel_by_boat.yaml → ...ark/task_configs/hard/travel_by_boat.yaml b/...val/task_configs/hard/travel_by_boat.yaml → ...ark/task_configs/hard/travel_by_boat.yaml
diff --git a/.../auto_eval/task_configs/hard/use_bow.yaml → .../benchmark/task_configs/hard/use_bow.yaml b/.../auto_eval/task_configs/hard/use_bow.yaml → .../benchmark/task_configs/hard/use_bow.yaml
diff --git a/...to_eval/task_configs/hard/use_shield.yaml → ...nchmark/task_configs/hard/use_shield.yaml b/...to_eval/task_configs/hard/use_shield.yaml → ...nchmark/task_configs/hard/use_shield.yaml
diff --git a/...o_eval/task_configs/hard/use_trident.yaml → ...chmark/task_configs/hard/use_trident.yaml b/...o_eval/task_configs/hard/use_trident.yaml → ...chmark/task_configs/hard/use_trident.yaml
diff --git a/...k/auto_eval/task_configs/simple/base.yaml → ...o/benchmark/task_configs/simple/base.yaml b/...k/auto_eval/task_configs/simple/base.yaml → ...o/benchmark/task_configs/simple/base.yaml
diff --git a/...ask_configs/simple/build_a_waterfall.yaml → ...ask_configs/simple/build_a_waterfall.yaml b/...ask_configs/simple/build_a_waterfall.yaml → ...ask_configs/simple/build_a_waterfall.yaml
diff --git a/minestudio/benchmark/task_configs/simple/build_dig3fill1.yaml b/minestudio/benchmark/task_configs/simple/build_dig3fill1.yaml
@@ -0,0 +1,7 @@
+custom_init_commands:
+- /give @s minecraft:dirt 15
+- /give @s minecraft:stone_shovel
+defaults:
+- base
+- _self_
+text: Build a 3x3 area filled with dirt blocks.
diff --git a/..._eval/task_configs/simple/build_gate.yaml → ...hmark/task_configs/simple/build_gate.yaml b/..._eval/task_configs/simple/build_gate.yaml → ...hmark/task_configs/simple/build_gate.yaml
diff --git a/...val/task_configs/simple/build_golems.yaml → ...ark/task_configs/simple/build_golems.yaml b/...val/task_configs/simple/build_golems.yaml → ...ark/task_configs/simple/build_golems.yaml
diff --git a/...k_configs/simple/build_nether_portal.yaml → ...k_configs/simple/build_nether_portal.yaml b/...k_configs/simple/build_nether_portal.yaml → ...k_configs/simple/build_nether_portal.yaml
diff --git a/...l/task_configs/simple/build_obsidian.yaml → ...k/task_configs/simple/build_obsidian.yaml b/...l/task_configs/simple/build_obsidian.yaml → ...k/task_configs/simple/build_obsidian.yaml
diff --git a/...val/task_configs/simple/build_pillar.yaml → ...ark/task_configs/simple/build_pillar.yaml b/...val/task_configs/simple/build_pillar.yaml → ...ark/task_configs/simple/build_pillar.yaml
diff --git a/...task_configs/simple/build_snow_golem.yaml → ...task_configs/simple/build_snow_golem.yaml b/...task_configs/simple/build_snow_golem.yaml → ...task_configs/simple/build_snow_golem.yaml
diff --git a/...ask_configs/simple/build_snow_golems.yaml → ...ask_configs/simple/build_snow_golems.yaml b/...ask_configs/simple/build_snow_golems.yaml → ...ask_configs/simple/build_snow_golems.yaml
diff --git a/.../task_configs/simple/build_waterfall.yaml → .../task_configs/simple/build_waterfall.yaml b/.../task_configs/simple/build_waterfall.yaml → .../task_configs/simple/build_waterfall.yaml
diff --git a/...al/task_configs/simple/carve_pumpkin.yaml → ...rk/task_configs/simple/carve_pumpkin.yaml b/...al/task_configs/simple/carve_pumpkin.yaml → ...rk/task_configs/simple/carve_pumpkin.yaml
diff --git a/...l/task_configs/simple/carve_pumpkins.yaml → ...k/task_configs/simple/carve_pumpkins.yaml b/...l/task_configs/simple/carve_pumpkins.yaml → ...k/task_configs/simple/carve_pumpkins.yaml
diff --git a/...to_eval/task_configs/simple/clean_up.yaml → ...nchmark/task_configs/simple/clean_up.yaml b/...to_eval/task_configs/simple/clean_up.yaml → ...nchmark/task_configs/simple/clean_up.yaml
diff --git a/...sk_configs/simple/climb_the_mountain.yaml → ...sk_configs/simple/climb_the_mountain.yaml b/...sk_configs/simple/climb_the_mountain.yaml → ...sk_configs/simple/climb_the_mountain.yaml
diff --git a/...val/task_configs/simple/collect_dirt.yaml → ...ark/task_configs/simple/collect_dirt.yaml b/...val/task_configs/simple/collect_dirt.yaml → ...ark/task_configs/simple/collect_dirt.yaml
diff --git a/...al/task_configs/simple/collect_grass.yaml → ...rk/task_configs/simple/collect_grass.yaml b/...al/task_configs/simple/collect_grass.yaml → ...rk/task_configs/simple/collect_grass.yaml
diff --git a/...task_configs/simple/collect_seagrass.yaml → ...task_configs/simple/collect_seagrass.yaml b/...task_configs/simple/collect_seagrass.yaml → ...task_configs/simple/collect_seagrass.yaml
diff --git a/...val/task_configs/simple/collect_wood.yaml → ...ark/task_configs/simple/collect_wood.yaml b/...val/task_configs/simple/collect_wood.yaml → ...ark/task_configs/simple/collect_wood.yaml
diff --git a/...val/task_configs/simple/collect_wool.yaml → ...ark/task_configs/simple/collect_wool.yaml b/...val/task_configs/simple/collect_wool.yaml → ...ark/task_configs/simple/collect_wool.yaml
diff --git a/.../task_configs/simple/combat_enderman.yaml → .../task_configs/simple/combat_enderman.yaml b/.../task_configs/simple/combat_enderman.yaml → .../task_configs/simple/combat_enderman.yaml
diff --git a/...l/task_configs/simple/combat_enemies.yaml → ...k/task_configs/simple/combat_enemies.yaml b/...l/task_configs/simple/combat_enemies.yaml → ...k/task_configs/simple/combat_enemies.yaml
diff --git a/...task_configs/simple/combat_skeletons.yaml → ...task_configs/simple/combat_skeletons.yaml b/...task_configs/simple/combat_skeletons.yaml → ...task_configs/simple/combat_skeletons.yaml
diff --git a/...al/task_configs/simple/combat_spider.yaml → ...rk/task_configs/simple/combat_spider.yaml b/...al/task_configs/simple/combat_spider.yaml → ...rk/task_configs/simple/combat_spider.yaml
diff --git a/...l/task_configs/simple/combat_spiders.yaml → ...k/task_configs/simple/combat_spiders.yaml b/...l/task_configs/simple/combat_spiders.yaml → ...k/task_configs/simple/combat_spiders.yaml
diff --git a/...l/task_configs/simple/combat_zombies.yaml → ...k/task_configs/simple/combat_zombies.yaml b/...l/task_configs/simple/combat_zombies.yaml → ...k/task_configs/simple/combat_zombies.yaml
diff --git a/...ask_configs/simple/craft_enchantment.yaml → ...ask_configs/simple/craft_enchantment.yaml b/...ask_configs/simple/craft_enchantment.yaml → ...ask_configs/simple/craft_enchantment.yaml
diff --git a/...val/task_configs/simple/craft_ladder.yaml → ...ark/task_configs/simple/craft_ladder.yaml b/...val/task_configs/simple/craft_ladder.yaml → ...ark/task_configs/simple/craft_ladder.yaml
diff --git a/...al/task_configs/simple/craft_ladders.yaml → ...rk/task_configs/simple/craft_ladders.yaml b/...al/task_configs/simple/craft_ladders.yaml → ...rk/task_configs/simple/craft_ladders.yaml
diff --git a/...l/task_configs/simple/craft_smelting.yaml → ...k/task_configs/simple/craft_smelting.yaml b/...l/task_configs/simple/craft_smelting.yaml → ...k/task_configs/simple/craft_smelting.yaml
diff --git a/...l/task_configs/simple/craft_stonecut.yaml → ...k/task_configs/simple/craft_stonecut.yaml b/...l/task_configs/simple/craft_stonecut.yaml → ...k/task_configs/simple/craft_stonecut.yaml
diff --git a/...eval/task_configs/simple/craft_table.yaml → ...mark/task_configs/simple/craft_table.yaml b/...eval/task_configs/simple/craft_table.yaml → ...mark/task_configs/simple/craft_table.yaml
diff --git a/...figs/simple/craft_the_crafting_table.yaml → ...figs/simple/craft_the_crafting_table.yaml b/...figs/simple/craft_the_crafting_table.yaml → ...figs/simple/craft_the_crafting_table.yaml
diff --git a/...al/task_configs/simple/craft_to_cake.yaml → ...rk/task_configs/simple/craft_to_cake.yaml b/...al/task_configs/simple/craft_to_cake.yaml → ...rk/task_configs/simple/craft_to_cake.yaml
diff --git a/...l/task_configs/simple/craft_to_clock.yaml → ...k/task_configs/simple/craft_to_clock.yaml b/...l/task_configs/simple/craft_to_clock.yaml → ...k/task_configs/simple/craft_to_clock.yaml
diff --git a/..._configs/simple/craft_to_craft_table.yaml → ..._configs/simple/craft_to_craft_table.yaml b/..._configs/simple/craft_to_craft_table.yaml → ..._configs/simple/craft_to_craft_table.yaml
diff --git a/.../task_configs/simple/craft_to_ladder.yaml → .../task_configs/simple/craft_to_ladder.yaml b/.../task_configs/simple/craft_to_ladder.yaml → .../task_configs/simple/craft_to_ladder.yaml
diff --git a/...o_eval/task_configs/simple/cut_stone.yaml → ...chmark/task_configs/simple/cut_stone.yaml b/...o_eval/task_configs/simple/cut_stone.yaml → ...chmark/task_configs/simple/cut_stone.yaml
diff --git a/...imple/dig_three_down_and_fill_one_up.yaml → ...imple/dig_three_down_and_fill_one_up.yaml b/...imple/dig_three_down_and_fill_one_up.yaml → ...imple/dig_three_down_and_fill_one_up.yaml
diff --git a/..._configs/simple/drink_harming_potion.yaml → ..._configs/simple/drink_harming_potion.yaml b/..._configs/simple/drink_harming_potion.yaml → ..._configs/simple/drink_harming_potion.yaml
diff --git a/...configs/simple/enchant_diamond_sword.yaml → ...configs/simple/enchant_diamond_sword.yaml b/...configs/simple/enchant_diamond_sword.yaml → ...configs/simple/enchant_diamond_sword.yaml
diff --git a/...al/task_configs/simple/enchant_sword.yaml → ...rk/task_configs/simple/enchant_sword.yaml b/...al/task_configs/simple/enchant_sword.yaml → ...rk/task_configs/simple/enchant_sword.yaml
diff --git a/...val/task_configs/simple/explore_boat.yaml → ...ark/task_configs/simple/explore_boat.yaml b/...val/task_configs/simple/explore_boat.yaml → ...ark/task_configs/simple/explore_boat.yaml
diff --git a/...al/task_configs/simple/explore_chest.yaml → ...rk/task_configs/simple/explore_chest.yaml b/...al/task_configs/simple/explore_chest.yaml → ...rk/task_configs/simple/explore_chest.yaml
diff --git a/...al/task_configs/simple/explore_climb.yaml → ...rk/task_configs/simple/explore_climb.yaml b/...al/task_configs/simple/explore_climb.yaml → ...rk/task_configs/simple/explore_climb.yaml
diff --git a/...val/task_configs/simple/explore_mine.yaml → ...ark/task_configs/simple/explore_mine.yaml b/...val/task_configs/simple/explore_mine.yaml → ...ark/task_configs/simple/explore_mine.yaml
diff --git a/...eval/task_configs/simple/explore_run.yaml → ...mark/task_configs/simple/explore_run.yaml b/...eval/task_configs/simple/explore_run.yaml → ...mark/task_configs/simple/explore_run.yaml
diff --git a/..._configs/simple/explore_the_treasure.yaml → ..._configs/simple/explore_the_treasure.yaml b/..._configs/simple/explore_the_treasure.yaml → ..._configs/simple/explore_the_treasure.yaml
diff --git a/...val/task_configs/simple/find_diamond.yaml → ...ark/task_configs/simple/find_diamond.yaml b/...val/task_configs/simple/find_diamond.yaml → ...ark/task_configs/simple/find_diamond.yaml
diff --git a/...eval/task_configs/simple/find_forest.yaml → ...mark/task_configs/simple/find_forest.yaml b/...eval/task_configs/simple/find_forest.yaml → ...mark/task_configs/simple/find_forest.yaml
diff --git a/...val/task_configs/simple/find_village.yaml → ...ark/task_configs/simple/find_village.yaml b/...val/task_configs/simple/find_village.yaml → ...ark/task_configs/simple/find_village.yaml
diff --git a/...val/task_configs/simple/hunt_a_sheep.yaml → ...ark/task_configs/simple/hunt_a_sheep.yaml b/...val/task_configs/simple/hunt_a_sheep.yaml → ...ark/task_configs/simple/hunt_a_sheep.yaml
diff --git a/...val/task_configs/simple/hunt_animals.yaml → ...ark/task_configs/simple/hunt_animals.yaml b/...val/task_configs/simple/hunt_animals.yaml → ...ark/task_configs/simple/hunt_animals.yaml
diff --git a/...val/task_configs/simple/lead_animals.yaml → ...ark/task_configs/simple/lead_animals.yaml b/...val/task_configs/simple/lead_animals.yaml → ...ark/task_configs/simple/lead_animals.yaml
diff --git a/...imple/make_fire_with_flint_and_steel.yaml → ...imple/make_fire_with_flint_and_steel.yaml b/...imple/make_fire_with_flint_and_steel.yaml → ...imple/make_fire_with_flint_and_steel.yaml
diff --git a/...configs/simple/make_obsidian_by_wate.yaml → ...configs/simple/make_obsidian_by_wate.yaml b/...configs/simple/make_obsidian_by_wate.yaml → ...configs/simple/make_obsidian_by_wate.yaml
diff --git a/...task_configs/simple/mine_diamond_ore.yaml → ...task_configs/simple/mine_diamond_ore.yaml b/...task_configs/simple/mine_diamond_ore.yaml → ...task_configs/simple/mine_diamond_ore.yaml
diff --git a/...o_eval/task_configs/simple/mine_dirt.yaml → ...chmark/task_configs/simple/mine_dirt.yaml b/...o_eval/task_configs/simple/mine_dirt.yaml → ...chmark/task_configs/simple/mine_dirt.yaml
diff --git a/..._eval/task_configs/simple/mine_grass.yaml → ...hmark/task_configs/simple/mine_grass.yaml b/..._eval/task_configs/simple/mine_grass.yaml → ...hmark/task_configs/simple/mine_grass.yaml
diff --git a/...ask_configs/simple/mine_horizontally.yaml → ...ask_configs/simple/mine_horizontally.yaml b/...ask_configs/simple/mine_horizontally.yaml → ...ask_configs/simple/mine_horizontally.yaml
diff --git a/...al/task_configs/simple/mine_iron_ore.yaml → ...rk/task_configs/simple/mine_iron_ore.yaml b/...al/task_configs/simple/mine_iron_ore.yaml → ...rk/task_configs/simple/mine_iron_ore.yaml
diff --git a/...al/task_configs/simple/mine_obsidian.yaml → ...rk/task_configs/simple/mine_obsidian.yaml b/...al/task_configs/simple/mine_obsidian.yaml → ...rk/task_configs/simple/mine_obsidian.yaml
diff --git a/...val/task_configs/simple/plant_wheats.yaml → ...ark/task_configs/simple/plant_wheats.yaml b/...val/task_configs/simple/plant_wheats.yaml → ...ark/task_configs/simple/plant_wheats.yaml
diff --git a/...a_birthday_present_for_your_neighbor.yaml → ...a_birthday_present_for_your_neighbor.yaml b/...a_birthday_present_for_your_neighbor.yaml → ...a_birthday_present_for_your_neighbor.yaml
diff --git a/.../task_configs/simple/run_and_explore.yaml → .../task_configs/simple/run_and_explore.yaml b/.../task_configs/simple/run_and_explore.yaml → .../task_configs/simple/run_and_explore.yaml
diff --git a/...o_eval/task_configs/simple/set_fires.yaml → ...chmark/task_configs/simple/set_fires.yaml b/...o_eval/task_configs/simple/set_fires.yaml → ...chmark/task_configs/simple/set_fires.yaml
diff --git a/...al/task_configs/simple/shoot_phantom.yaml → ...rk/task_configs/simple/shoot_phantom.yaml b/...al/task_configs/simple/shoot_phantom.yaml → ...rk/task_configs/simple/shoot_phantom.yaml
diff --git a/...val/task_configs/simple/sleep_in_bed.yaml → ...ark/task_configs/simple/sleep_in_bed.yaml b/...val/task_configs/simple/sleep_in_bed.yaml → ...ark/task_configs/simple/sleep_in_bed.yaml
diff --git a/...task_configs/simple/sleep_on_the_bed.yaml → ...task_configs/simple/sleep_on_the_bed.yaml b/...task_configs/simple/sleep_on_the_bed.yaml → ...task_configs/simple/sleep_on_the_bed.yaml
diff --git a/..._eval/task_configs/simple/smelt_food.yaml → ...hmark/task_configs/simple/smelt_food.yaml b/..._eval/task_configs/simple/smelt_food.yaml → ...hmark/task_configs/simple/smelt_food.yaml
diff --git a/...l/task_configs/simple/survive_combat.yaml → ...k/task_configs/simple/survive_combat.yaml b/...l/task_configs/simple/survive_combat.yaml → ...k/task_configs/simple/survive_combat.yaml
diff --git a/...val/task_configs/simple/survive_hunt.yaml → ...ark/task_configs/simple/survive_hunt.yaml b/...val/task_configs/simple/survive_hunt.yaml → ...ark/task_configs/simple/survive_hunt.yaml
diff --git a/...al/task_configs/simple/survive_plant.yaml → ...rk/task_configs/simple/survive_plant.yaml b/...al/task_configs/simple/survive_plant.yaml → ...rk/task_configs/simple/survive_plant.yaml
diff --git a/...al/task_configs/simple/survive_sleep.yaml → ...rk/task_configs/simple/survive_sleep.yaml b/...al/task_configs/simple/survive_sleep.yaml → ...rk/task_configs/simple/survive_sleep.yaml
diff --git a/...to_eval/task_configs/simple/tool_bow.yaml → ...nchmark/task_configs/simple/tool_bow.yaml b/...to_eval/task_configs/simple/tool_bow.yaml → ...nchmark/task_configs/simple/tool_bow.yaml
diff --git a/..._eval/task_configs/simple/tool_flint.yaml → ...hmark/task_configs/simple/tool_flint.yaml b/..._eval/task_configs/simple/tool_flint.yaml → ...hmark/task_configs/simple/tool_flint.yaml
diff --git a/...o_eval/task_configs/simple/tool_lead.yaml → ...chmark/task_configs/simple/tool_lead.yaml b/...o_eval/task_configs/simple/tool_lead.yaml → ...chmark/task_configs/simple/tool_lead.yaml
diff --git a/...val/task_configs/simple/tool_pumpkin.yaml → ...ark/task_configs/simple/tool_pumpkin.yaml b/...val/task_configs/simple/tool_pumpkin.yaml → ...ark/task_configs/simple/tool_pumpkin.yaml
diff --git a/...val/task_configs/simple/tool_trident.yaml → ...ark/task_configs/simple/tool_trident.yaml b/...val/task_configs/simple/tool_trident.yaml → ...ark/task_configs/simple/tool_trident.yaml
diff --git a/...l/task_configs/simple/travel_by_boat.yaml → ...k/task_configs/simple/travel_by_boat.yaml b/...l/task_configs/simple/travel_by_boat.yaml → ...k/task_configs/simple/travel_by_boat.yaml
diff --git a/...uto_eval/task_configs/simple/use_bow.yaml → ...enchmark/task_configs/simple/use_bow.yaml b/...uto_eval/task_configs/simple/use_bow.yaml → ...enchmark/task_configs/simple/use_bow.yaml
diff --git a/..._eval/task_configs/simple/use_shield.yaml → ...hmark/task_configs/simple/use_shield.yaml b/..._eval/task_configs/simple/use_shield.yaml → ...hmark/task_configs/simple/use_shield.yaml
diff --git a/...eval/task_configs/simple/use_trident.yaml → ...mark/task_configs/simple/use_trident.yaml b/...eval/task_configs/simple/use_trident.yaml → ...mark/task_configs/simple/use_trident.yaml
diff --git a/minestudio/benchmark/test.py b/minestudio/benchmark/test.py
@@ -0,0 +1,67 @@
+'''
+Date: 2024-12-06 16:35:39
+LastEditors: zhengxinyue
+LastEditTime: 2024-12-11 17:47:25
+FilePath: /MineStudio/minestudio/benchmark/test.py
+'''
+import sys
+sys.path.append('/home/user/code/MineStudio/')
+import os
+import ray
+from rich import print
+from minestudio.inference import EpisodePipeline, MineGenerator, InfoBaseFilter
+from minestudio.benchmark.read_conf import convert_yaml_to_callbacks
+from functools import partial
+from minestudio.models import load_openai_policy
+from minestudio.simulator import MinecraftSim
+from minestudio.simulator.callbacks import (
+    SpeedTestCallback, 
+    RecordCallback, 
+    SummonMobsCallback, 
+    MaskActionsCallback, 
+    RewardsCallback, 
+    CommandsCallback, 
+    TaskCallback,
+    FastResetCallback
+)
+
+import pdb
+
+
+if __name__ == '__main__':
+    ray.init()
+    conf_path = './task_configs/simple'
+
+    for file_name in os.listdir(conf_path):
+        if file_name.endswith('.yaml'):
+            file_path = os.path.join(conf_path, file_name)
+            commands_callback, task_callback = convert_yaml_to_callbacks(file_path)
+
+            env = MinecraftSim(
+                obs_size=(128, 128), 
+                preferred_spawn_biome="forest", 
+                callbacks=[
+                    RecordCallback(record_path=f"./output/{file_name}", fps=30, frame_type="pov"),
+                    CommandsCallback(commands_callback),
+                    TaskCallback(task_callback),
+                ]
+            )
+            # pdb.set_trace()
+            policy = load_openai_policy(
+                model_path="/nfs-shared/jarvisbase/pretrained/foundation-model-2x.model",
+                weights_path="/nfs-shared/jarvisbase/pretrained/foundation-model-2x.weights"
+            ).to("cuda")
+
+            memory = None
+            obs, info = env.reset()
+            for i in range(1200):
+                action, memory = policy.get_action(obs, memory, input_shape='*')
+                obs, reward, terminated, truncated, info = env.step(action)
+            env.close()
+
+
+
+
+
+
+