核心对象与属性
对象/属性 | 描述 | 示例 |
---|
cl::Platform | 表示OpenCL平台 | cl::Platform::get(&platforms) |
cl::Device | 表示计算设备 | cl::Device::getDefault() |
cl::Context | 管理设备、内存和命令队列的上下文 | cl::Context(contextDevices) |
cl::CommandQueue | 命令队列,用于提交命令 | cl::CommandQueue(context, device) |
cl::Program | OpenCL程序对象 | cl::Program(context, sources) |
cl::Kernel | 内核函数对象 | cl::Kernel(program, "kernel_name") |
cl::Buffer | 内存缓冲区对象 | cl::Buffer(context, flags, size) |
cl::Image1D/Image2D等 | 图像对象 | cl::Image1D(context, flags, format, width, host_ptr) |
cl::Pipe | 管道对象 | cl::Pipe(context, flags, packet_size, max_packets) |
Platform 属性与函数
Platform 对象代表 OpenCL 实现平台,通常对应不同的硬件供应商(如 NVIDIA、AMD、Intel 等)。选择适当的平台对应用性能有重要影响。
Platform 对象创建与获取
对象/函数 | 描述 | 示例 |
---|
cl::Platform | Platform 对象 | cl::Platform::get(&platforms) |
cl::Platform::get(vector<Platform>*) | 获取所有可用平台 | cl::Platform::get(&platformList) |
cl::Platform::getDefault() | 获取默认平台 | cl::Platform platform = cl::Platform::getDefault() |
Platform 信息查询函数
函数 | 描述 | 返回类型 |
---|
cl::Platform::getInfo<info_type>(param_name) | 获取平台信息 | 取决于查询参数 |
cl::Platform::getDevices(device_type, vector<Device>*) | 获取平台关联的设备 | vector<cl::Device> |
Platform 查询参数
查询参数 | 描述 | 返回类型 |
---|
CL_PLATFORM_PROFILE | 平台支持的OpenCL规范 | string |
CL_PLATFORM_VERSION | OpenCL版本信息 | string |
CL_PLATFORM_NAME | 平台名称 | string |
CL_PLATFORM_VENDOR | 平台供应商 | string |
CL_PLATFORM_EXTENSIONS | 支持的扩展 | string |
CL_PLATFORM_ICD_SUFFIX_KHR | ICD后缀(需要扩展) | string |
Platform 扩展函数
函数 | 描述 | 备注 |
---|
cl::Platform::getHostTimerResolution() | 获取主机计时器分辨率(OpenCL 2.1+) | 需要 cl_khr_host_timer_resolution 扩展 |
cl::Platform::unloadCompiler() | 卸载编译器资源 | |
Platform 属性常量
常量 | 值 | 描述 |
---|
CL_PLATFORM_PROFILE_FULL | "FULL_PROFILE" | 完整规范支持 |
CL_PLATFORM_PROFILE_EMBEDDED | "EMBEDDED_PROFILE" | 嵌入式规范支持 |
示例代码
cpp
// 1. 获取所有平台
vector<cl::Platform> platforms;
cl::Platform::get(&platforms);// 2. 遍历平台信息
for (auto &platform : platforms) {string name = platform.getInfo<CL_PLATFORM_NAME>();string vendor = platform.getInfo<CL_PLATFORM_VENDOR>();string version = platform.getInfo<CL_PLATFORM_VERSION>();cout << "Platform: " << name << "\n"<< "Vendor: " << vendor << "\n"<< "Version: " << version << endl;// 3. 获取设备列表vector<cl::Device> devices;platform.getDevices(CL_DEVICE_TYPE_ALL, &devices);// 4. 检查扩展支持string extensions = platform.getInfo<CL_PLATFORM_EXTENSIONS>();if (extensions.find("cl_khr_icd") != string::npos) {cout << "ICD extension supported" << endl;}
}// 5. 获取默认平台
cl::Platform defaultPlatform = cl::Platform::getDefault();// 6. 卸载编译器(减少资源占用)
defaultPlatform.unloadCompiler();
平台选择实用技巧
cpp
// 1. 按供应商选择平台
cl::Platform selectPlatform(const string &vendor) {vector<cl::Platform> platforms;cl::Platform::get(&platforms);for (auto &platform : platforms) {string platformVendor = platform.getInfo<CL_PLATFORM_VENDOR>();if (platformVendor.find(vendor) != string::npos) {return platform;}}throw runtime_error("No platform found for vendor: " + vendor);
}// 2. 检查平台版本
bool checkPlatformVersion(cl::Platform &platform, int major, int minor) {string version = platform.getInfo<CL_PLATFORM_VERSION>();int platMajor, platMinor;sscanf(version.c_str(), "OpenCL %d.%d", &platMajor, &platMinor);return (platMajor > major) || (platMajor == major && platMinor >= minor);
}
错误处理
错误码 | 描述 |
---|
CL_INVALID_PLATFORM | 无效的平台对象 |
CL_INVALID_VALUE | 无效的查询参数 |
CL_OUT_OF_HOST_MEMORY | 主机内存不足 |
Device
属性与函数
Device 对象代表 OpenCL 可用的计算设备,了解设备属性和能力对于优化 OpenCL 程序性能至关重要。实际编程中应根据设备特性调整内核参数和工作组大小。
Device 对象获取
对象/函数 | 描述 | 示例 |
---|
cl::Device | Device 对象 | cl::Device::getDefault() |
cl::Platform::getDevices(device_type, devices) | 获取平台关联的设备 | platform.getDevices(CL_DEVICE_TYPE_GPU, &devices) |
cl::Device::getDefault() | 获取默认设备 | cl::Device device = cl::Device::getDefault() |
设备信息查询函数
函数 | 描述 |
---|
cl::Device::getInfo<info_type>(param_name) | 获取设备信息 |
cl::Device::getSupportedImageFormats(context, flags, image_type) | 获取支持的图像格式 |
设备类型常量
常量 | 描述 |
---|
CL_DEVICE_TYPE_CPU | CPU 设备 |
CL_DEVICE_TYPE_GPU | GPU 设备 |
CL_DEVICE_TYPE_ACCELERATOR | 加速器设备 |
CL_DEVICE_TYPE_CUSTOM | 自定义设备 |
CL_DEVICE_TYPE_ALL | 所有设备类型 |
设备基本信息查询
查询参数 | 描述 | 返回类型 |
---|
CL_DEVICE_NAME | 设备名称 | string |
CL_DEVICE_VENDOR | 设备供应商 | string |
CL_DEVICE_VERSION | OpenCL 版本 | string |
CL_DRIVER_VERSION | 驱动版本 | string |
CL_DEVICE_PROFILE | 支持规范(FULL/EMBEDDED) | string |
CL_DEVICE_TYPE | 设备类型 | cl_device_type |
设备能力信息
查询参数 | 描述 | 返回类型 |
---|
CL_DEVICE_MAX_COMPUTE_UNITS | 计算单元数量 | cl_uint |
CL_DEVICE_MAX_CLOCK_FREQUENCY | 最大时钟频率(MHz) | cl_uint |
CL_DEVICE_ADDRESS_BITS | 地址宽度(位) | cl_uint |
CL_DEVICE_AVAILABLE | 设备是否可用 | cl_bool |
CL_DEVICE_COMPILER_AVAILABLE | 编译器是否可用 | cl_bool |
内存信息
查询参数 | 描述 | 返回类型 |
---|
CL_DEVICE_GLOBAL_MEM_SIZE | 全局内存大小(字节) | cl_ulong |
CL_DEVICE_LOCAL_MEM_SIZE | 局部内存大小(字节) | cl_ulong |
CL_DEVICE_MAX_CONSTANT_BUFFER_SIZE | 常量内存大小(字节) | cl_ulong |
CL_DEVICE_GLOBAL_MEM_CACHE_SIZE | 全局内存缓存大小 | cl_ulong |
CL_DEVICE_MAX_MEM_ALLOC_SIZE | 最大内存分配大小 | cl_ulong |
执行限制
查询参数 | 描述 | 返回类型 |
---|
CL_DEVICE_MAX_WORK_GROUP_SIZE | 最大工作组大小 | size_t |
CL_DEVICE_MAX_WORK_ITEM_DIMENSIONS | 最大工作项维度 | cl_uint |
CL_DEVICE_MAX_WORK_ITEM_SIZES | 各维度最大工作项大小 | vector<size_t> |
图像支持
查询参数 | 描述 | 返回类型 |
---|
CL_DEVICE_IMAGE_SUPPORT | 是否支持图像 | cl_bool |
CL_DEVICE_IMAGE2D_MAX_WIDTH | 2D图像最大宽度 | size_t |
CL_DEVICE_IMAGE2D_MAX_HEIGHT | 2D图像最大高度 | size_t |
CL_DEVICE_IMAGE3D_MAX_WIDTH | 3D图像最大宽度 | size_t |
CL_DEVICE_IMAGE3D_MAX_HEIGHT | 3D图像最大高度 | size_t |
CL_DEVICE_IMAGE3D_MAX_DEPTH | 3D图像最大深度 | size_t |
扩展功能
查询参数 | 描述 | 返回类型 |
---|
CL_DEVICE_EXTENSIONS | 支持的扩展 | string |
CL_DEVICE_PREFERRED_VECTOR_WIDTH_<type> | 各种类型的向量宽度 | cl_uint |
设备分区相关(OpenCL 2.0+)
查询参数 | 描述 |
---|
CL_DEVICE_PARTITION_MAX_SUB_DEVICES | 最大子设备数量 |
CL_DEVICE_PARTITION_PROPERTIES | 支持的分区类型 |
CL_DEVICE_PARTITION_AFFINITY_DOMAIN | 支持的亲和域 |
实用函数示例
cpp
// 1. 获取设备基本信息
void printDeviceInfo(cl::Device &device) {cout << "Device: " << device.getInfo<CL_DEVICE_NAME>() << "\n"<< "Vendor: " << device.getInfo<CL_DEVICE_VENDOR>() << "\n"<< "Version: "