from azureml.core import Workspace
ws = Workspace.from_config()
datastore = ws.get_default_datastore()


datastore = ws.get_default_datastore()


datastores = Datastore.register_azure_blob_container(
    workspace=ws,
    datastore_name='<datastore-name>',
    container_name='<container-name>',
    account_name='<account-name>',
    account_key='<account-key>',
)


datastores = Datastore.register_azure_blob_container(
    workspace=ws,
    datastore_name='<datastore-name>',
    container_name='<container-name>',
    account_name='<account-name>',
    sas_token='<sas-token>',
)


ws.datastores: Dict[str, Datastore]


datastore = ws.datastores['<name-of-registered-datastore>']


from azureml.core import Workspace
ws = Workspace.from_config()
datastore = ws.datastores['<name-of-datastore>']


datastore.upload(
    src_dir='./data',
    target_path='<path/on/datastore>',
    overwrite=True,
    )


datastore.upload_files(
    files, # List[str] of absolute paths of files to upload
    target_path='<path/on/datastore>',
    overwrite=False,
    )


datastore.download(
    target_path, # str: local directory to download to
    prefix='<path/on/datastore>',
    overwrite=False,
    )


from azureml.core import Workspace
ws: Workspace = Workspace.from_config()
compute_target: ComputeTarget = ws.compute_targets['<compute-target-name>']
ds: Datastore = ws.get_default_datastore()


data_ref = ds.path('<path/on/datastore>').as_mount()


data_ref = ds.path('<path/on/datastore>').as_download()


config = ScriptRunConfig(
    source_directory='.',
    script='script.py',
    arguments=[str(data_ref)],               #returns environment variable $AZUREML_DATAREFERENCE_example_data
    compute_target=compute_target,           #the Compute resources taken in the instance  
)

config.run_config.data_references[data_ref.data_reference_name] = data_ref.to_config()


data_ref = ds.path('<path/on/datastore>').as_mount()
data_ref.path_on_compute = '/tmp/data'

config = ScriptRunConfig(
    source_directory='.',
    script='script.py',
    compute_target=compute_target,
)

config.run_config.data_references[data_ref.data_reference_name] = data_ref.to_config()


from azureml.core import Dataset

# upload the data to datastore and create a FileDataset from it 
folder_data = Dataset.File.upload_directory(src_dir="path/to/folder", target=(datastore, "self-defined/path/on/datastore"))
dataset = folder_data.register(workspace=ws, name="<dataset_name>")


from azureml.core import Dataset

# create input dataset
data = Dataset.File.from_files(path=(datastore, "path/on/datastore"))
dataset = data.register(workspace=ws, name="<dataset_name>")


from azureml.core import ScriptRunConfig
from azureml.data import OutputFileDatasetConfig

output_data = OutputFileDatasetConfig(
    destination=(datastore, "path/on/datastore"),
    name="<output_name>",
)

config = ScriptRunConfig(
        source_directory=".",
        script="run.py",
        arguments=["--output_dir", output_data.as_mount()],
)

# register your OutputFileDatasetConfig as a dataset
output_data_dataset = output_data.register_on_complete(name="<dataset_name>", description = "<dataset_description>")


datastore = ws.get_default_datastore()
datastore.upload(src_dir='./data', target_path='<path/on/datastore>', overwrite=True)


datastore = ws.get_default_datastore()
dataset = Dataset.File.from_files(path=(datastore, '<path/on/datastore>'))


arguments=[dataset.as_mount()]
config = ScriptRunConfig(source_directory='.', script='train.py', arguments=arguments)
experiment.submit(config)


import sys
data_dir = sys.argv[1]

print("===== DATA =====")
print("DATA PATH: " + data_dir)
print("LIST FILES IN DATA DIR...")
print(os.listdir(data_dir))
print("================")

Data Store¶

DataSet¶

Link datastore to Azure Storage Explorer¶

Blob DataBase/DataStore¶

Read from Datastore Explorer¶

Data Reference¶

Consume DataReference in ScriptRunConfig¶

Without specifying argument¶

Create Dataset¶

From local data¶

From a `datastore`¶

From outputs using `OutputFileDatasetConfig`¶

Upload to datastore¶

Create dataset from files in datastore¶

Use Dataset¶

ScriptRunConfig¶

Data Store¶

DataSet¶

Link datastore to Azure Storage Explorer¶

Blob DataBase/DataStore¶

Read from Datastore Explorer¶

Data Reference¶

Consume DataReference in ScriptRunConfig¶

Without specifying argument¶

Create Dataset¶

From local data¶

From a datastore¶

From outputs using OutputFileDatasetConfig¶

Upload to datastore¶

Create dataset from files in datastore¶

Use Dataset¶

ScriptRunConfig¶

From a `datastore`¶

From outputs using `OutputFileDatasetConfig`¶